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内 容 提 要 

本 书 使 读者 不 仅 能 够 深入 了 解 MySQL 这 种 主流 数据 库 ， 还 能 全 面 掌握 开源 数据 库 新 秀 
MariaDB 的 使 用 方法 。 书 中 内 容 由 浅 至 深 、 层 层 深 入 ， 从 分 步 介 绍 如 何 安 装 MySQL 和 MariaDB， 
到 以 虚构 的 观 鸟 网 站 为 例 ， 详 解数 据 库 的 各 种 操作 。 具 体内 容 包 括 : 数据 库 的 结构 ; 数据 的 插入 、 
选取 、 更 新 、 删 除 、 连 接 和 子 查询 ; 字符 串 函 数 、 日 斯 和 时 间 函 数 、 聚 合 函数 与 数值 函数 等 。 最 后 
一 个 部 分 从 更 高 的 角度 介绍 数据 库 的 管理 ， 内 容 涉及 用 户 账 号 及 权限 、 数 据 库 的 备份 与 恢复 ， 以 
及 利用 应 用 编程 接口 结合 C、Perl、PHP、Python、Ruby 等 不 同 语言 与 数据 库 交 互 。 

本 书面 向 想 要 从 头 开 始 学 习 并 快速 掌握 数据 库 核心 知识 与 实践 方法 的 读者 。 
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在 你 阅读 书 中 MySQL 和 MariaDB 的 内 容 之 前 ， 我 打算 先 讲 讲 ， 我 们 分 别 在 大 约 20 年 前 
和 5 年 前 创建 MySQL 和 MariaDB 的 目的 ， 以 及 这 两 个 数据 库 系统 的 现状 与 我 对 它们 未 来 
的 期 望 。 我 认为 ， 这 会 有 助 于 你 了 解 它们 。 顺 便 ， 为 了 给 你 打气 ， 我 想 告诉 你 ，MySQL 和 
MariaDB 是 长 盛 不 衰 的， 你 对 它们 的 钻研 以 及 你 在 此 书 上 花费 的 精力 ， 都 将 令 你 受用 良久 。 


MySQL 的 起 源 


我 和 我 的 商业 伙伴 David Axmark 之 所 以 会 创造 出 MySQL， 是 因为 那个 年 代 没 有 什么 好 用 
的 、 免 费 的 开源 数据 库 系统 。 我 们 当时 只 是 创建 了 一 个 类 似 mSQL 的 数据 库 ， 它 不 是 开 
源 的 。 但 这 个 数据 库 启发 我 们 为 客户 创造 出 一 个 新 的 数据 库 系 统 ， 这 就 是 后 来 的 MySQL。 
对 于 这 个 MySQL 的 锥 形 ， 我 们 并 没有 什么 宏大 的 开发 计划 ， 只 是 要 满足 客户 的 需求 。 
我 们 不 断 地 学 习 、 发 现 ， 并 根据 实际 需求 进行 开发 ， 作 为 本 书 的 读者 以 及 MySQL 和 
MariaDB 的 入 门 者 ， 你 可 能 也 在 这 样 做 。 


创造 好 之 后 没 多 久 ， 我 们 就 发 现 有 不 少 机 构 都 有 类 似 的 需求 。 既 然 我们 已 经 开发 好 了 这 个 
数据 库 ， 便 决定 将 其 对 外 开放 ， 并 给 其 取 名 为 MySQL。 

我 们 这 样 做 的 动机 之 一 是 觉得 这 东西 挺 有 用 的 ， 值 得 拿 来 回馈 开源 社区 (当时 很 多 开源 项 
目 都 是 没什么 用 的 ) 。 我 们 希望 这 个 世界 变 得 更 美好 一 点 一 当时 我 们 真 不 知道 MySQL 会 
有 现在 这 么 大 的 影响 力 。 同 时 ， 我 们 也 希望 将 MySQL 公之于众 能 够 带 来 收益 ， 以 便 资 助 
MySQL 的 长 期 开发 。 当 然 ， 我 们 也 想 通过 MySQL 来 致富 。 因 为 觉得 这 东西 应 该 是 有 前 途 
的 ， 所 以 我 们 全 身心 地 投入 进去 。 而 事实 上 ， 结 果 是 我 们 为 这 个 世界 作出 了 很 大 贡献 ， 其 
至 远 远 超出 我 们 的 想象 。 


如 今 ， 世 界 上 80% 以 上 的 网 站 都 在 用 MySQL， 可 以 说 MySQL 推动 了 互联 网 以 及 由 互联 
网 而 生 的 一 切 事 物 的 发 展 。 其 影响 力 是 不 可 估量 的 。 如 果 没 有 免费 又 可 靠 的 MySQL, 许 
多 成 功 的 (包括 现在 一 些 大 型 的 ) 网 站 和 企业 ， 可 能 根本 无 法 诞生 。 因 为 在 当时 ， 很 多 创 
始 人 和 创业 公司 都 没 钱 创 建 网 站 。 商 业 数 据 库 软 件 的 价格 不 菲 ， 一 些 最 有 创造 性 的 网 络 组 
织 ， 如 谷歌 、 维 基 百 科 和 Facebook， 都 难以 跨 过 这 一 障碍 。 另 外 ， 商 业 数据 库 还 有 其 他 
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缺点 。 例 如 ， 互 联网 公司 对 访问 性 能 有 很 高 要 求 ， 但 商业 数据 库 却 对 这 方面 宣 不 关注 。 此 
外 ， 商 业 数据 库 需要 专门 的 开发 人 员 来 使 用 和 管理 ， 而 这 些 人 的 工资 要 求 也 相当 之 高 。 


正 因 如 此 ，MySQL 非常 符合 创业 公司 的 要 求 ， 可 以 帮助 它们 成 为 互联 网 的 重要 组 成 部 分 ， 
以 及 大 多 数 人 的 日 常 所 需 。MySQL 曾经 是 而 且 目 前 依然 是 互联 网 发 展 中 的 一 个 关键 要 素 ， 
而 且 这 在 未 来 也 不 会 改变 ， 因 为 MySQL 的 使 用 量 依然 在 增长 ， 而 MariaDB 则 势头 更 劲 。 
那些 认为 新 的 数据 库 或 NoSQL 会 令 MySQL 跌价 的 人 ， 终 将 发 现 自己 站 错 队伍 。 


由 于 MySQL 称霸 已 入 ， 无 法 撼动 ， 而 且 人 们 总 是 习惯 使 用 熟悉 的 东西 ， 所 以 就 算 有 更 
好 的 东西 出 现 ， 可 能 也 难以 取而代之 。 若 真 要 取代 MySQL 开源 数据 库 的 霸主 地 位 ， 除 
了 要 有 更 好 的 功能 ， 还 要 允许 用 户 运 用 现 有 的 知识 轻松 地 迁移 数据 。 而 MariaDB 就 是 在 
MySQL 的 基础 上 ， 拥 有 更 多 的 功能 和 潜能 ， 因 此 ， 我 们 认为 MariaDB 就 是 MySQL 的 替 
代 者 。 


MySQL 和 MariaDB 的 现状 


当然 ，MySQL 和 MariaDB 都 不 是 完美 的 。 事 实 上 ， 任 何 数 据 库 都 不 是 完美 的 ， 但 对 大 多 
数 人 来 说 它 俩 已 足够 优秀 。 我 们 既 要 方便 网 站 的 开发 ， 又 要 提供 良好 的 性 能 。 所 以 ， 我 们 
采用 多 线程 技术 ， 这 使 我 们 在 负载 方面 优 于 很 多 同行 。 此 外 ， 我 们 自始至终 采用 最 先进 的 
技术 ， 努 力 兼容 新 硬件 并 优化 各 种 常用 软件 和 部 署 方式 。 我 们 在 软件 改进 上 精益 求 精 ， 可 
以 每 个 月 发 布 社区 版 的 一 个 小 更 新 ， 每 年 公开 一 个 新 版 本 。 而 这 也 表明 ， 我 们 的 社区 运作 
正常 ， 稳 步 发 展 。 


所 有 学 习 和 想 要 使 用 MySQL 和 MariaDB 的 人 ， 都 不 用 担心 接口 的 改变 ， 因 为 我 们 开发 的 
数据 库 一 直 在 适应 环境 的 改变 ， 无 论 时 代 怎 样 变迁 ， 你 要 的 功能 永远 都 在 。 这 也 确实 是 我 
们 令 人 信赖 的 一 点 。 有 些 软件 时 不 时 搞 一 些 标新立异 的 功能 ， 甚 至 过 一 两 年 就 换 一 个 全 新 
的 系统 ， 而 这 在 MySQL 和 MariaDB 身上 是 不 会 发 生 的 。 


之 前 我 们 讲 过 ， 要 取代 MySQL 这 个 霸主 是 不 容易 的 ， 所 以 我 们 尽量 让 MariaDB 贴近 
MySQL， 让 你 无 痛 迁 移 。 另 外 ， 我 们 还 在 (并 将 在 ) MariaDB 上 加 入 很 多 好 用 的 功能 ， 以 
便 你 获得 更 好 的 使 用 体验 。 所 以 ，MariaDB 也 是 一 个 不 错 的 选择 。 


不 只 是 服务 器 


除了 用 于 网 站 开发 ， 嵌 入 其 他 软件 后 ，MySQL 和 MariaDB 还 可 用 于 单独 的 应 用 程序 。 尤 
其 是 嵌入 式 方面 ， 它 们 近来 的 增长 幅度 比 以 往 任何 时 候 都 要 大 。 另 外 ， 由 于 现在 流行 使 用 
云 服务 器 ， 而 在 云 中 部 署 商业 数据 库 十 分 昂贵 ， 所 以 ，MySQL 和 MariaDB 在 这 方面 也 成 
为 了 大 众 的 首选 。 

同样 ， 在 移动 开发 方面 ， 它 们 也 是 最 佳 方案 。 无 论 你 的 应 用 是 部 署 于 云端 还 是 自 建 服务 
器 ， 依 靠 MySQL 和 MariaDB 出 众 的 扩展 性 ， 你 将 无 惧 因 为 移动 设备 普及 而 带 来 的 爆 
发 式 访问 增长 (事实 上 有 些 网 站 的 移动 端 访 问 其 至 多 于 桌面 端 )。 此 外 ， 如 果 你 用 的 是 
MariaDB 10.1， 那 么 它 新 引入 的 加 密 功 能 将 使 应 用 的 安全 性 更 上 一 层 楼 ， 而 这 是 很 多 其 他 
数据 库 产 品 不 能 提供 的 。 
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MariaDB: 差异 和 希望 


我 对 MariaDB 是 充满 希望 的 ， 我 正在 MariaDB 基金 会 工作 ， 致 力 于 拉拢 其 他 公司 协同 开 
发 。 这 在 MySQL 的 发 展 过 程 中 是 缺失 的 ， 所 以 ，MySQL 无 法 满足 全 世界 ， 无 法 满足 未 
来 。 但 我 们 希望 MariaDB 能 做 到 ， 这 就 需要 更 多 公司 的 合作 。 我 们 十 分 开心 看 到 谷歌 的 
参与 ， 同 时 还 希望 更 多 这 样 的 大 公司 参与 进来 。 此 外 ， 光 有 大 众 的 支持 也 是 不 够 的 ， 像 
自由 与 开源 软件 基金 会 ， 它 有 很 多 公司 参与 开发 ， 但 其 中 没有 负责 协调 工作 的 。 我 期 望 
MariaDB 基金 会 能 起 到 协调 的 作用 ， 令 大 家 的 努力 都 能 用 到 点 上 。 当 然 ， 这 反 过 来 也 是 对 
大 家 有 益 的 。 而 对 于 Oracle 控制 下 的 MySQL， 就 不 用 在 这 方面 指望 太 多 了 。Oracle 可 没 
有 保证 会 在 未 来 继续 开放 MySQL 的 代码 。 而 MariaDB 则 不 同 ， 它 是 由 始 至 终 、 全 心 全 意 
地 开源 的 。 所 以 很 明显 ，MariaDB 比 MySQL 更 加 遵守 开源 规则 ， 更 加 贴近 多 数 人 的 想法 。 
MariaDB 基金 会 的 作用 ， 就 是 确保 MariaDB 的 开发 过 程 公平 、 公 开 、 公 正 。 它 将 保证 
MariaDB 始终 开源 ， 这 是 它 的 首要 职责 。MariaDB 基金 会 的 另 一 个 职责 是 确保 所 有 想 要 开 
发 MariaDB 的 公司 都 以 平等 的 方式 参与 开发 。 如 果 有 公司 为 MariaDB 提供 了 补丁 ， 他 们 
可 以 进行 提交 ， 而 下 一 版 的 MariaDB 将 包含 该 补丁 。 这 是 很 多 自称 开源 的 软件 项 目 做 不 到 
的 ， 包括 MySQL ( 当 你 想 给 它 提交 补丁 时 ，Oracle 极 有 可 能 是 不 理 你 的 )。 而 MariaDB 的 
包容 则 天 性 使 然 ， 我 们 乐意 接受 任何 意见 。 


举 个 例子 ， 假 设 MariaDB 的 竞争 对 手 Percona 想 给 MariaDB 提交 一 个 补丁 ， 以 使 其 后 台 软 
件 XtraBackup 能 运行 得 更 好 。 当 然 ，MariaDB 是 不 想 帮助 范 争 对 手 的 ， 但 是 ， 这 也 不 由 它 
话 事 。 只 要 基金 会 认可 那个 补丁 ， 那 么 就 会 加 上 ， 因 为 基金 会 是 只 看 技术 ,不 考虑 商业 因 
素 的 。 


一 个 开源 软件 要 想 存 活 ， 就 必须 能 够 解决 实际 问题 。 虽 然 MySQL 一 开始 有 各 种 不 足 ， 包 
括 功能 少 ， 但 它 一直 聆 听 大 众 的 需求 ， 因 此 才 得 以 成 为 数据 库 界 的 黑马 ， 冲 出 重围 。 这 一 
点 ， 我 们 在 MariaDB 上 做 得 更 加 努力 。 尽 管 MariaDB 也 不 可 能 完全 符合 所 有 人 的 要 求 ， 
但 它 会 比 别 的 产品 更 好 。 


MySQL 和 MariaDB 的 未 来 


如 果 你 将 来 打算 从 事 MariaDB 相关 的 工作 ， 将 能 享受 到 我 们 牛人 齐集 的 开发 团队 的 全 力 
的 、 长 期 的 支持 。 


拿 近 来 发 布 的 MariaDB 10.1 来 说 ， 它 之 所 以 兼容 Galera 集群 (用 于 管理 并 行 数据 库 ) 这 
一 功能 ， 正 是 为 了 更 好 地 支持 新 的 加 密 功能 。 为 什么 要 这 样 大 费 周 章 呢 ? 因为 在 过 去 的 几 
个 月 里 ， 一 些 政府 部 门 和 大 企业 遭受 了 黑客 攻击 ， 致 使 人 们 对 软件 行业 的 安全 问题 十 分 担 
忧 。 而 更 好 的 加 密 技 术 ， 将 使 数据 更 难 被 窃取 。MariaDB 的 这 一 努力 就 是 为 了 改变 人 们 认 
为 开源 软件 安全 性 不 佳 的 印象 ， 并 证 明 自 己 是 紧 跟 时 代 的 。 虽 然 如 今 不 少 商业 数据 库 开发 
商都 误导 人 们 ， 说 MySQL 和 MariaDB 不 够 安全 ， 从 而 骗取 更 多 生意 ， 但 是 我 相信 ， 只 要 
你 用 过 MariaDB 10.1， 就 会 明白 那 是 谣言 ， 同 时 知道 MariaDB 是 优 于 MySQL 的 。 


如 果 你 对 编译 好 的 商业 数据 库 是 否 留 有 后 门 抱 有 怀疑 ， 或 者 担心 开源 软件 是 否 安全 ， 那 
么 ,最 直接 的 办 法 就 是 去 检查 我 们 提供 的 开源 代码 。 因 为 我 们 的 代码 非常 坦白 ， 所 以 我 
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， 有 以 上 担忧 的 组 织 或 国家 ， 在 未 来 应 该 都 会 成 为 我 们 快速 扩展 的 市 场 。 而 且 ， 说 来 讽 
事实 上 越 是 遮 谈 掩 掩 的 政府 和 组 织 ， 越 应 该 喜欢 开源 软件 ， 因 为 开源 软件 的 仇家 比 商 
业 软 件 的 要 少 ， 更 不 容易 遭受 攻击 和 破解 。 


学 习 MySQL 和 MariaDB 的 前 途 


MySQL 和 MariaDB 都 兼容 SQL， 它 是 一 种 有 大 约 30 年 历史 的 编程 语言 。 虽 然 SQL 一 直 
没 多 大 改变 ， 但 它 功 能 强大 ， 随 处 可 见 。 只 要 你 掌握 好 某 一 套 SQL 数据 库 ， 那 么 想 迁 移 到 
另 一 种 ， 是 没什么 难度 的 。 也 就 是 说 ， 学 习 MySQL 或 MariaDB， 对 你 的 数据 库 开发 和 管 
时 生涯 有 百 利 而 无 一 害 。 现 在 还 没有 任何 迹象 表明 MySQL 或 MariaDB 会 在 50 年 后 消失 ， 
事实 上 ，MySQL 在 过 去 20 年 提出 的 所 有 概念 ， 在 今天 甚至 未 来 几 十 年 ， 都 不 会 失色 。 唯 
一 的 变化 是 会 加 入 新 功能 ， 以 便 人 们 完成 特殊 任务 。 而 本 书 中 介绍 的 通用 技能 ， 将 使 你 终 
身受 益 。 


有 关 学 习 MySQL 和 MariaDB 的 建议 


想 学 好 MySQL 和 MariaDB ， 只 读本 书 是 不 够 的 ， 你 还 得 安装 MySQL 或 MariaDB ， 执 行 
书 中 的 示例 ， 并 完成 每 章 后 面 的 习题 。 此 外 ， 还 要 应 用 书 中 提 到 的 SQL 语句 、 函 数 和 工具 
来 做 些 自己 的 玩意 。 如 果 不 去 实践 的 话 ， 那 么 你 看 过 的 东西 都 会 忘记 。 如 果 你 想 不 出 要 搞 
些 什 么 玩意 ， 可 以 试 试用 MySQL 或 MariaDB 来 创建 一 个 网 站 ， 并 尽量 去 解决 各 种 数据 库 
相关 的 问题 。 只 要 你 持之以恒 地 操练 自己 ， 就 会 学 到 更 多 。 不 断 实践 ， 才 能 将 基础 打 牢 。 
除 此 之 外 ， 你 还 可 以 通过 加 入 论坛 、 邮 件 列 表 和 了 RC 来 学 习 更 多 知识 ， 在 社区 积 插 人 气 ， 


以 及 开发 出 商业 网 站 (这 甚至 可 以 助 你 找到 好 工作 )。 用 所 学 的 知识 帮助 别人 ， 你 不 仅 会 
受 人 欢迎 ， 还 会 因为 解释 各 种 概念 而 理解 得 更 加 深刻 。 
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Monty Widenius 
2015 年 1 月 于 西班牙 马 拉 加 
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献 给 我 的 母亲 Fortunata Serio， 是 她 给 了 我 生命 ， 并 教 我 向 善 、 有 爱 ， 以 及 说 话 
说 话 可 当 不 了 作家 。 
也 献 给 我 的 继父 Andrew Gambos， 他 一 直 默 默 地 支持 我 ， 并 教会 我 如 何 自 力 更 生 。 





不 会 





人 三 所 


MySQL 是 当今 最 流行 的 开源 数据 库 ， 高 效 且 稳定 ， 备 受 公众 网 站 的 青睐 。 即 使 你 对 它 不 
熟悉 ， 也 可 能 天 天 都 在 跟 它 打交道 。 当 你 登录 谷歌 、 亚 马 逊 、Facebook 和 维基 百科 等 知名 
网 站 时 ， 就 会 用 到 MySQL。 不 仅 许 多 大 型 网 站 用 它 保存 数据 ， 数 之 不 尽 的 小 网 站 也 在 用 
着 它 。 此 外 ， 很 多 非 网 络 应 用 也 采用 MySQL 作为 数据 库 。 在 需要 时 ， 它 可 以 发 挥 快速 、 
稳定 和 小 巧 的 优点 。 


1995 年 ，MySQL 由 Michael“Monty” Widenius 和 David Axmark 创造 ， 并 使 用 GNU 通用 
公共 授权 。 当 年 他 们 在 瑞典 创立 了 MySQL Ab (Ab 是 瑞典 语 中 的 有 限 公司 或 股份 公司 )， 
而 该 公司 几 年 后 又 成 了 美国 的 MySQL Inc. (英语 incorporated 的 缩写 ) 。 直 到 2008 年 1 月 ， 
它 被 Sun 公司 收购 。 尽 管 Sun 说 “我 们 绝对 会 大 力 发 展 MySQL ， 但 在 2009 年 4 月 ， 它 
自身 却 被 Oracle 收购 了 。 因 为 Oracle 是 卖 财 源 数据 库 的 ， 可 以 说 是 MySQL 的 一 大 竞争 对 
手 ， 所 以 当时 很 多 人 担心 MySQL 这 个 改变 世界 的 开源 软件 会 就 此 被 扼杀 。 不 过 事实 证 明 ， 
在 收购 五 年 之 后 ， 这 种 情况 都 没有 发 生 。 我 们 可 以 看 到 ， 现 在 MySQL 的 功能 更 加 丰富 了 ， 
而 其 相关 的 开发 者 (无 论 是 在 Oracle 内 部 还 是 外 部 ) 数量 也 增加 了 不 少 。 

出 于 对 Oracle 收购 的 不 爽 ，Monty 又 开 了 一 家 新 公司 Monty Program Ab， 它 在 MySQL 
的 基础 上 开发 出 了 一 个 分 支 MariaDB。' 因为 MySQL 是 遵循 GPL 协议 的 ， 所 以 使 用 它 
或 往 它 身上 添加 东西 都 是 免费 和 合法 的 。 与 此 同时 ，MySQL Inc. 服务 部 的 前 高 级 副 总 裁 
Ulf Sandberg， 以 及 MySQL 的 一 班 老 员工 ， 离 开 Sun 和 Oracle， 建 立 了 SkySQL Ab， 为 
MySQL 和 MariaDB 用 户 提供 支持 、 咨 询 和 培训 等 服务 。2013 年 10 月 ，Monty Program Ab 
合并 到 SkySQL Ab 中 ， 该 公司 在 2014 年 10 月 改名 为 MariaDB Ab。 而 MariaDB 的 授权 认 
证 则 由 MariaDB 基金 会 控 管 ， 而 不 是 Oracle 或 其 他 公司 。 
















































































注 1: 顺便 提 一 名 ，MySQL 的 这 个 名 字 来 源 于 Monty Widenius 的 第 一 个 女儿 ，My Widenius。 而 MariaDB 
则 源 于 其 第 二 个 女儿 ，Maria Widenius 。 
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现在 ， 有 些 相关 的 社区 ， 因 为 不 想 与 大 型 专利 软件 公司 扯 上 关系 ， 所 以 也 将 数据 迁移 到 了 
MariaDB。 此 外 ， 不 少 操作 系统 发 行 版 、 硬 件 和 软件 包 ， 也 把 自 带 的 数据 库 改 为 MariaDB 
(可 能 带 上 MySQL， 或 完全 不 带 ) 。 因 为 灰 换 并 不 困难 ， 应 用 层 不 需 修改 任何 代码 (当然 ， 
如 果 你 想 使 用 MariaDB 有 而 MySQL 没有 的 功能 ， 那 就 需要 加 入 新 的 调用 命令 )， 所 以 许 
多 网 站 也 愿意 追随 这 一 测 流 。 


尽管 所 有 权 、 公 司 名 ， 甚 至 软件 名 经 历 多 次 变更 ， 但 这 个 软件 在 社区 中 相传 近 30 年 的 精 
神 与 内 涵 却 没有 丢失 。 

MySQL 和 MariaDB 简单 易 懂 ， 没 有 什么 学 习 门 槛 。 如 果 你 想 从 头 开 始 ， 并 快速 形成 生产 
力 ， 那 么 本 书 可 以 作为 你 的 入 门 书 。 当 然 ， 对 于 稍 有 基础 但 未 得 要 领 的 同学 ， 本 书 也 是 非 
常 合 适 的 。 因 为 MySQL 和 MariaDB 的 基本 操作 是 一 样 的 ， 所 以 这 本 入 门 书 的 内 容 同时 适 
用 于 两 者 ， 你 可 将 文中 的 MySQL 理解 为 MariaDB ， 反 之 亦 可 。 


阅读 方法 

一 般 来 说 ， 你 应 按 本 书 的 章节 编排 顺序 读 下 去 。 但 这 并 不 是 说 你 不 能 跳 过 某 些 章节 。 尤 其 
是 ， 很 多 人 都 会 跳 过 第 一 部 分 。 要 是 你 已 装 好 MySQL， 那 么 就 可 以 不 用 看 第 1 章 (导论 
部 分 ) 和 第 2 章 (讲述 如 何 安装 MySQL 和 MariaDB) 了 。 要 是 你 从 未 用 过 MySQL， 就 不 
应 该 略 过 第 3 章 。 而 之 后 的 章节 ， 除 了 第 五 部 分 (这 部 分 的 章节 与 管理 技术 有 关 ， 并 非 所 
有 人 马上 都 能 用 到 )， 你 都 应 该 按 顺 序 学 习 到 底 。 


大 多 数 章 市 最 后 都 有 一 套 练 习题 ， 它 们 可 以 帮助 你 思考 之 前 读 到 的 内 容 。 通 过 完成 这 些 习 
题 ， 你 会 巩固 在 该 章 示例 中 学 到 的 知识 。 另 外 ， 淮 试 练习 所 有 章节 中 给 出 的 示例 ， 你 会 受 
益 良 多 。 各 章 后 面 的 习题 ， 就 算 不 以 前 一 章 的 知识 为 基础 ， 也 是 以 前 面 的 章节 为 基础 ， 所 
以 你 需要 学 好 前 面 的 知识 ， 才 能 顺利 完成 它们 。 


文字 界面 与 操作 系统 


因为 Windows 的 风行 ， 导 致 很 多 人 都 以 为 ， 用 GUI (图 形 用 户 界面 ) 来 操作 复杂 的 软件 或 
系统 是 最 快捷 的 做 法 。 确 实 ， 一 图 胜 千 言 ， 但 如 果 你 不 是 要 表达 很 复杂 的 东西 ， 是 不 需要 
图 形 的 。 换 名 话说， 如 果 你 只 对 数据 库 进行 一 些 很 小 的 改动 ， 是 不 需要 用 GUI 的 。 

尤其 是 ， 我 不 喜欢 用 GUI 来 操作 MySQL 或 服务 器 ， 因 为 GUI 每 次 更 新 换代 都 会 变样 ， 而 
命令 行 却 十 年 如 一 日 ， 处 处 通用 。 如 果 你 知道 如 何 从 命令 行 配置 服务 器 ， 那 么 就 能 轻松 应 
对 各 种 服务 器 。 所 以 ， 本 书 的 示例 是 文字 界面 的 ， 它 们 应 该 在 任何 地 方 都 能 运行 (其实 仅 
限于 Unix 类 的 操作 系统 的 命令 行 ， 如 Linux。 如 果 你 使 用 其 他 操作 系统 ， 请 自己 找 办 法 调 


出 命令 行 )。 


排版 约定 


本 书 使 用 了 下 列 排版 约定 。 






















































































































































































。 楷体 
表示 新 术语 。 
. 等 宽 字 体 (constant width ) 
表示 程序 片段 ， 以 及 正文 中 出 现 的 变量 、 国 数 名 、 数 据 库 、 数 据 类 型 、 环 境 变量 、 语 
句 和 关键 字 等 。 
。 加 粗 等 宽 字 体 (constant width botLd ) 
表示 应 该 由 用 户 输入 的 命令 或 其 他 文本 。 


。 等 宽 和 斜体 (constant width italic) 
表示 应 该 由 用 户 输入 的 值 或 根据 上 下 文 确定 的 值 替 换 的 文本 。 





该 图 标 表示 提示 或 建议 。 


该 图 标 表示 一 般 注 记 。 





该 图 标 表示 警告 或 警示 。 





使 用 代码 示例 


本 书 的 所 有 程序 和 脚本 都 可 从 http://mysqlresources.com/files 下 载 ， 并 任 由 复制 和 修改 。 


本 书 旨 在 帮助 你 学 习 MySQL 和 MariaDB ， 或 完成 MySQL 和 MariaDB 的 相关 工作 。 一 般 
来 说 ， 如 果 本 书 提供 了 示例 代码 ， 你 可 以 把 它 用 在 你 的 程序 或 文档 中 。 除 非 你 使 用 了 很 大 
一 部 分 代码 ， 否 则 无 需 联 系 我 们 获得 许可 。 比 如 ， 用 本 书 的 几 个 代码 片段 写 一 个 程序 就 无 
需 获 得 许可 ， 销 售 或 分 发 OReilly 图 书 的 示例 光盘 则 需要 获得 许可 ， 引 用 本 书 中 的 示例 代 
码 回 答 问 题 无 需 获 得 许可 ， 将 书 中 大 量 的 代码 放 到 你 的 产品 文档 中 则 需要 获得 许可 。 


我 们 很 希望 但 并 不 强制 要 求 你 在 引用 本 书 内 容 时 加 上 引用 说 明 。 引 用 说 明 一 般 包 括 书 
名 、 作 者 、 出 版 社 和 ISBN。 比 如 ;“Learning MySQL and MariaDB by Russell J.T. Dyer 
(O’Reilly). Copyright 2015 Russell J.T. Dyer, 978-1-449-36290-4.” 




















如 果 你 觉得 自己 对 示例 代码 的 用 法 超出 了 上 述 许可 的 范围 ， 欢 迎 你 通过 permissions@ 
oreilly.com 与 我 们 联系 。 





Safari? Books Online 


Safari Books Online (http:/www.safaribooksonline.com) 是 应 运 
Sa fa 『 上 而 生 的 教 字 图 书馆 。 它 同时 以 图 书 和 视频 的 形式 出 版 世界 硕 级 
上 上 。 技术 和 商务 作家 的 专业 作品 。 技 术 专家 、 软 件 开发 人 员 、Web 
设计 师 、 商 务 人 士 和 创意 专家 等 ， 在 开展 调研 、 解 决 问题 
习 和 认证 培训 时 ， 都 将 Safari Books Online 视 作 获取 资料 的 首选 渠道 。 
对 于 组 织 团 体 、 政 府 机 构 和 个 人 ，Safari Books Online 提供 各 种 产品 组 合 和 灵活 的 定 
价 策略 。 用 户 可 通过 一 个 功能 完备 的 数据 库 检 索 系 统 访问 O'Reilly Media、Prentice 
Hall Professional、Addison-Wesley Professional、 Microsoft Press、Sams、Que、Peachpit 




















Press、 Focal Press、 Cisco Press、 John Wiley & Sons、 Syngress、 Morgan Kaufmann、IBM 
Redbooks、 Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、 
Jones & Bartlett、Course Technology 以 及 其 他 儿 十 家 出 版 社 的 上 千 种 图 书 、 培 训 视 频 和 下 
式 出 版 之 前 的 书稿 。 要 了 解 Safari Books Online 的 更 多 信息 ， 我 们 网 上 见 。 


联系 我 们 
请 把 对 本 书 的 评价 和 问题 发 给 出 版 社 。 
美国 ， 
O’Reilly Media, Inc. 
1005 Gravenstein Highway North 
Sebastopol, CA 95472 
中 国 : 
北京 市 西城 区 西直门 南大 街 2 号 成 铭 大 厦 C 座 807 室 (100035) 
奥 菜 利 技术 咨询 (北京) 有限 公司 
O’Reilly 的 每 一 本 书 都 有 专属 网 页 ， 你 可 以 在 那儿 找到 本 书 的 相关 信息 ， 包 括 勘误 表 、 示 


例 代码 以 及 其 他 信息 。 本 书 的 网 站 地 址 是 : 
http://shop.oreilly.com/product/0636920029175.do 


对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电 子 邮 件 到 : 
bookquestions @oreilly.com 

要 了 解 更 多 O’Reilly 图 书 、 培 训 课 程 、 会 议和 新 闻 的 信息 ， 请 访问 以 下 网 站 : 
http://www.oreilly.com 


我 们 在 Facebook 的 地 址 如 下 : 
http://facebook.com/oreilly 
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xx | 前 言 


请 


我 


关注 我 们 的 Twitter 动态 : 
http://twitter.com/oreillymedia 


们 的 YouTube 视频 地 址 如 下 : 
http://www.youtube.com/oreillymedia 


致谢 


如 
编 


口 


他 





谢 我 的 同事 Colin Charles、Kenneth Dyer、Chad Hudson、Caryn-Amy Rose 和 Sveta Smirnova。 
果 没 有 他 们 对 草稿 中 技术 等 各 种 问题 的 审阅 和 建议 ， 本 书 是 不 可 能 完成 的 。 感 谢 我 的 
辑 Andy Oram， 对 我 寄予 厚望 并 在 我 们 相识 的 多 年 里 一 直 支 持 着 我 。 感 谢 我 的 两 位 上 
曾经 历 过 MySQL Ab 和 SkySQL/MariaDB Ab 的 Ulf Sandberg 和 Max Mether， 在 
们 的 英明 领导 下 ， 我 工作 得 非常 愉快 。 同 时 ， 还 要 感谢 我 的 同事 兼 好 友 Rusty Osborne 





























Johnson， 他 在 本 书 的 创作 上 也 耐心 地 给 予 我 不 少 帮助 。 


电子 书 


扫 


描 如 下 二 维 码 ， 即 可 购买 本 书 电子 版 。 











第 一 部 分 


软件 





MySQL 和 MariaDB 最 主要 的 部 分 是 服务 器 。 在 这 里 ， 服 务 器 指 的 是 软件 ， 而 不 是 指 运行 
这 个 软件 的 计算 机 。 该 服务 器 可 以 维护 、 控 制 和 保护 你 的 数据 ， 将 它们 以 各 种 格式 存储 在 
文件 中 ， 而 这 些 文件 正 是 放 在 运行 服务 器 的 计算 机 上 。 服 务 器 监听 来 自 其 他 软件 的 请 求 
(这 种 情况 下 ， 这 些 软件 被 称 为 客户 端 ) 。 在 这 里 ， 客 户 端 指 的 是 软件 ， 而 不 是 计算 机 。 客 
户 端 和 服务 器 可 以 在 同一 台 计 算 机 上 同时 运行 ， 该 计算 机 可 以 是 一 台 笔 记 本 电脑 。 


刚 开 始 ， 我 们 会 使 用 命令 行 客户 端 ， 在 其 中 手工 输入 请 求 。 接 着 ， 我 们 会 从 其 他 程序 中 发 
这 些 程序 包括 备份 软件 以 及 其 他 操作 数据 的 软件 。 你 不 需要 通晓 构成 MySQL 的 
所 有 文件 和 程序 。 不 过 ， 还 是 有 一 些 关键 部 分 是 需要 注意 的 。 


其 中 一 个 关键 程序 ， 就 是 服务 器 mysqLd (d 代表 daemon， 即 守护 进程 ， 通 常服 务 器 都 是 守 
护 进程 )。MySQL 和 MariaDB 的 守护 进程 都 叫 mysqld。 该 守护 进程 必须 一 直 运 行 着 ， 这样 
人 们 才能 访问 并 修改 数据 。 如 果 你 是 管理 员 ， 你 就 有 能 力 进行 配置 ， 使 mysqtLd 符合 你 建立 
数据 库 系统 的 需求 。 关 于 守护 进程 的 介绍 穿插 于 本 书 的 多 个 相关 章节 中 。 


而 另 一 个 关键 程序 ， 就 是 基本 的 MySQL 客户 端 ， 简 称 mysqL， 本 书 中 经 常用 到 它 。 
它 ， 你 就 可 以 与 mysqtd， 即 数据 库 ， 进 行 交 互 。 它 的 界面 是 文本 式 的 。 它 朴实 无 华 ， 连 鼠 
标 都 不 用 。 基 本 上 你 就 是 用 它 来 敲打 在 本 书 中 学 到 的 SQL 语句 。 语 句 的 结果 会 以 ASCII 
形式 展示 ， 看 上 去 非常 简洁 ， i 图 形 。 同 时 ， 因 为 只 有 文字 (没有 二 进 制 和 图 
像 文 件 )， 所 以 它 运行 得 很 快 。 我 们 会 在 第 3 章 讲 到 它 。 当 然 GUI 客户 端 也 是 有 的 ， 
多 数 MySQL 开发 者 和 管理 员 孝 倾向 于 ， 由 而 且 用 GUI 客户 端 发 送 的 命令 其 实 跟 你 
mysql 里 输入 的 没有 区 别 ， 所 以 我 就 不 介绍 它 了 。 
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MySQL 是 一 个 开源 、 多 线程 、 关 系 型 数据 库 管 理 系 统 ， 由 Michael “Monty”Widenius 于 
1995 年 开发 出 来 。2000 年 ，MySQL 以 双重 许可 形式 发 布 ， 根 据 GNU 的 通用 公共 许可 
(GPL) ， 人 们 可 以 免费 使 用 。 再 加 之 功能 繁多 、 运 行 稳定 ，MySQL 迅速 普及 。 


据 估计 ， 全 球 MySQL 的 装机 量 超过 600 万 ， 另 据 报 告 MySQL 每 天 的 下 载 量 超过 5 万 。 
作为 一 个 领先 的 数据 库 ，MySQL 的 成 功 不 仅 因为 它 的 价格 一 一 毕竟 ， 免 费 的 开源 数据 
因为 它 稳定 可 靠 、 性 能 高 、 功 能 强大 。 不 过 ，MariaDB 很 快 就 要 取代 
MySQL 了 ， 很 多 人 都 觉得 它 将 继承 MySQL 社区 的 精神 。 

如 果 你 的 工作 是 计算 机 编程 、 网 页 开发 或 者 与 更 广义 的 计算 机 技术 有 关 ， 那 么 学 习 
MySQL 和 MariaDB 将 对 你 有 益 。 很 多 企业 在 开发 和 维护 定制 软件 时 都 会 用 到 MySQL。 除 
此 之 外 ， 不 少 流行 的 网 站 和 软件 也 用 MySQL， 或 者 是 某 种 与 MySQL 概念 相通 的 数据 库 。 
无 论 你 是 数据 库 开 发 者 还 是 网 页 开发 者 ， 都 很 可 能 需要 或 受益 于 MySQL 方面 的 知 

。 因 此 ， 学 习 MySQL 和 MariaDB 是 你 计算 机 职业 生涯 的 重要 基础 。 


1.1 _ MySQL 和 MariaDB 的 价值 


MySQL 有 很 多 非凡 的 特性 ,尤其 是 速度 (可 参考 http://www.mysql.com/why-mysql/ 
benchmarks/ 中 各 时 期 的 基准 测试 )。MySQL 和 MariaDB 扩展 性 极 高 ， 可 以 处 理 上 万 个 表 
和 上 亿 行 数据 。 当 数据 量 不 多 时 ， 它 们 同样 快速 流畅 ， 非 常 适合 小 型 业务 或 业余 项 目 。 

任何 一 个 数据 库 管 理 系 统 的 关键 部 分 都 是 存储 引擎 ， 因 为 它 要 管理 所 有 查询 ， 以 及 用 户 
SQL 语句 与 数据 库 后 端 存储 之 间 的 接口 。MySQL 和 MariaDB 提供 了 几 种 各 有 优点 的 存储 
引擎 。 其 中 有 些 带 有 事务 功能 ， 允 许 回 深 数 据 (就 像 人 桌面 软件 中 我 们 熟悉 的 “撤销 ” 操 
作 )。MySQL 还 内 置 了 大 量 函 数 ， 这 些 我 们 会 在 本 书 的 不 同 章节 中 详 述 。 而 MariaDB 的 内 


















































置 函 数 则 在 MySQL 的 基础 上 还 多 出 一 些 。 另 外 ，MySQL 和 MariaDB 快速 稳定 的 更 新 也 
是 出 了 名 的 ， 每 一 版 的 更 新 都 会 给 大 家 带 来 新 功能 ， 以 及 速度 和 稳定 性 的 提升 。 


1.2 邮件 列表 和 论坛 


学 习 MySQL 和 MariaDB 时 ， 特 别 是 你 在 工作 中 初 用 MySQL 时 ， 人 懂得 上 哪儿 寻求 协助 
是 很 重要 的 。 遇 到 数据 库 的 问题 ， 你 可 以 到 Oracle 建立 的 一 些 MySQL 论坛 社区 (http:// 
forums.mysql.com/) 获得 免费 帮助 。 你 首先 应 该 进行 和 注册， 以便 发 问 或 帮助 别人 。 帮 助 
别人 会 使 你 学 到 很 多 东西 ， 因 为 这 会 加 深 你 对 MySQL 的 了 解 。 同 样 ， 类 似 的 资源 还 有 


MariaDB Ab (https:Wmariadb.com/resources/community-tools ) 


有 疑问 时 ， 你 可 以 在 论坛 上 查找 别人 是 否 问 过 类 似 的 问题 。 在 发 问 之 前 ， 最 好 先 搜 索 论 坛 
和 文档 。 如 果实 在 找 不 到 ， 再 提问 。 你 还 要 注意 将 问题 发 在 相关 的 版 块 里 。 


1.3 其 他 书籍 和 出 版 物 


MariaDB 提供 的 在 线 文档 (https://mariadb.com/kb/en/mariadb/documentation/)， 一 般 也 适用 
于 MySQL。Oracle 自己 所 有 的 产品 都 有 详尽 的 在 线 文 档 (http://dev.mysql.com/doc)， 包 括 
MySQL 服务 器 。 这 些 文档 因 MySQL 版 本 不 同 而 异 。 你 可 以 在 线 阅 读 ， 也 可 以 按 各 种 格式 
下 载 (如 HTML、PDF、EPUB)。 对 于 PDF 和 EPUB， 你 可 以 将 其 下 载 到 电子 阅读 器 中 。 
我 也 维护 着 一 个 网 站 (http://mysqlresources.com/)， 里 面包 含 一 些 文档 ， 以 及 衍生 自我 男 一 
本 书 《MySQL 核心 技术 手册 》 的 一 些 示 例 。 另 外 也 有 一 些 人 在 这 里 补充 了 其 他 示例 和 
资料 。 

除了 本 书 ，O'Reilly 还 出 版 了 其 他 一 些 值得 入 手 的 MySQL 相关 书籍 。 它 主推 的 MySQL 参 
考 书 是 我 写 的 《MySQL 核心 技术 手册 》。 如 果 需 要 解决 现实 中 的 常见 问题 ， 可 参考 Paul 
DuBois 的 《MySQL Cookbook (中 文 版 )》 若是 需要 调 优 和 性 能 监控 方面 的 建议 ， 如 数 
据 库 备份 ， 则 可 参考 Baron Schwartz、Peter Zaitsev 和 Vadim Tkachenko 合 著 的 《高 性 能 
MySQL》。 我 曾 与 这 两 本 书 的 作者 在 MySQL 公司 共事 ， 他 们 都 是 MySQL 方面 的 权威 ， 并 
且 在 圈 中 备 受 敬仰 。 


O'Reilly 也 出 版 过 几 本 MySQL 应 用 编程 接口 (API) 的 相关 书籍 。 对 于 PHP 和 MySQL 
开发 ， 有 Robin Nixon 的 Learning PHP MySQOL, JavaScript, CSS, and HTMLS (2014, http:// 
shop.oreilly.com/product/0636920036463.do)。 关 于 Perl 与 MySQL 及 其 他 数据 库 的 接口 ， 
则 有 Alligator Descartes 和 Tim Bunce 的 《Perl DBI 编程 》( 这 本 书 的 原版 在 2000 年 出 
版 ， 但 现在 依然 有 价值 )。 想 用 Java 连接 MySQL， 可 以 用 JDBC 和 JConnector 驱动 ， 而 
George Reese 的 《JDBC 与 Java 数据 库 编 程 》 是 这 方面 一 个 不 错 的 参考 。 


除了 书籍 之 外 ， 一 些 网 站 也 提供 了 MySQL 的 简明 教程 。 顺 便 说 下 ， 我 也 在 O'Reilly 博客 
和 其 他 相关 出 版 物 上 发 表 过 几 篇 有 关 MySQL 的 文章 。MySQL 的 网 站 亦 提 供 了 一 些 深 入 
介绍 (http:/dev.mysql.comy/tech-resources/articles) ， 其 中 不 少 都 是 讲 新 产品 和 新 特性 的 ， 甚 
至 还 包括 处 于 测试 阶段 的 东西 。 如 果 你 想 了 解 最 新 版 本 ， 这 些 文章 会 很 合适 你 。 除 了 投入 
时 间 阅 读 ， 所 有 这 些 在 线 出 版 物 都 不 要 求 你 支付 任何 费用 。 如 果 你 是 MySQL 的 支持 客户 ， 
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你 还 可 以 访问 它 的 私有 智库 (我 也 在 其 中 做 了 多 年 的 编辑 ) 。 

掌握 本 书 的 内 容 之 后 ， 如 果 你 还 想 获得 一 些 进 阶 的 培训 ，MariaDB Ab 提供 了 培训 课程 。 
MariaDB Ab 的 培训 页 面 (http:/www.skysql.com/products/mysql-training) 列 出 了 世界 各 地 
的 课程 ， 以 及 它们 的 开始 时 间 ， 其 中 有 些 是 一 到 两 天 的 课程 ， 有 些 是 持续 一 周 的 。 顺 便 说 
下 ， 我 是 MariaDB Ab 现任 的 课程 管理 人 。 




















第 2 章 


安装 MySQL 和 MariaDB 





MySQL 和 MariaDB 的 服务 器 与 客户 端 ， 能 在 好 几 种 操作 系统 上 运行 ， 准 确 来 说 ， 是 某 些 
Linux 的 发 行 版 、Mac OS X、FreeBSD、Sun Solaris 和 Windows。 





本 章 会 简单 地 介绍 如 何在 Linux、Mac OS X 和 Windows 上 安装 MySQL 和 MariaDB。 关 
于 如 何在 某 些 操作 系统 的 各 种 发 行 版 安装 ， 本 章 有 专门 的 小 节 讲 述 。 在 任何 一 种 操作 系统 
上 ， 安 装 MySQL 都 只 需 阅 读 这 三 节 内 容 : 2.4 节 、2.5 市 和 2.6 节 。 没 有 必要 了 解 所 有 版 
本 的 安装 方法 。 


2.1 安装 包 


MySQL 和 MariaDB 的 安装 包 带 有 几 个 程序 。 其 中 最 主要 的 是 服务 器 程序 ， 即 mysqld 守护 
进程 。 它 在 MySQL 和 MariaDB 中 是 同名 的 。 这 个 守护 进程 是 对 整个 数据 库 进 行 存储 和 操 
控 的 实际 执行 者 。 它 监听 着 一 个 特定 的 端口 (默认 是 3306) ， 这 个 端口 供用 户 提交 查询 。 
标准 的 MySQL 客户 端 就 叫 作 mysqL。 用 户 可 使 用 它 的 命令 行 接口 登录 和 执行 SQL 查询 。 
该 客户 端 还 能 接受 含有 查询 命令 的 文本 文件 ， 代 表 用 户 或 其 他 软件 执行 查询 。 不 过 ， 我 们 
大 多 使 用 各 种 编程 语言 来 跟 MYSQL 交互 。 有 关 Perl、PHP 以 及 其 他 语言 的 MySQL 接口 ， 
会 在 第 16 章 中 讲 到 。 

在 服务 器 安装 目录 中 ， 会 有 一 些 封装 好 的 脚本 。 而 运行 mysqtd 最 常见 的 方法 就 是 使 用 其 中 
的 mysqld_safe 脚本 ， 因 为 它 能 自动 重启 崩 江 的 守护 进程 。 这 有 助 于 令 数 据 库 服 务 的 宕 机 
时 间 最 小 化 。 如 有 果 你 是 初学 者 ， 那 么 你 无 需 掌 握 其 中 的 运作 细节 ， 但 告诉 你 这 些 ， 是 让 你 
知道 这 套数 据 库 系统 是 多 么 强大 。 



































注 1: 所 谓 守护 进程 ,就 是 一 个 在 后 台 持 续 运 行 的 进程 , 这 是 Unix 中 的 术语 , 而 大 多 数 人 就 叫 它 “ 服 务 器 ”。 

















MySQL 和 MariaDB 都 自 带 各 种 服务 器 管理 工具 。mysqlaccess 用 于 创建 用 户 账号 和 设置 权 
限 。mysqtadmin 则 是 命令 行 的 数据 库 服 务 器 管理 工具 。 你 可 以 用 它 来 交互 式 地 查询 服务 器 
的 状态 和 使 用 量 ， 以 及 关闭 服务 器 。 而 mnysqLshow 既 可 显示 各 数据 库 和 各 表 的 信息 ， 又 可 
查看 服务 器 状态 。 其 中 有 些 工具 需要 先 在 服务 器 上 安装 Perl， 如 果 用 Windows， 则 要 安装 
ActivePerl。 你 可 到 Perl 的 网 站 (http:/www.perl.org/) 或 ActivePerl 的 网 站 (http://www. 
activestate.comyactiveperl) 上 下 载 安 装 。 


另外 ， 还 有 一 些 导入 导出 数据 的 工具 。mysqtdump 是 最 流行 的 导出 dump 文件 (包含 表 结 构 
和 数据 的 纯 文 本 文件 ) 的 工具 。 这 使 得 我 们 可 以 备份 数据 ， 或 在 服务 器 之 间 复 制 数据 。 而 
mysql 客户 端 则 可 以 将 dump 文件 导 回 到 数据 库 中 。 具 体内 容 在 第 一 部 分 中 有 详解 。 


助手 工具 是 可 以 不 装 的 。 但 它们 不 是 什么 大 型 文件 ， 安 装 它们 也 不 耗费 什么 ， 所 以 你 也 可 
以 安装 并 使 用 。 


2.2 许可 


MySQL 是 免费 并 且 开 源 的 ， 但 它 的 开发 者 一 一 现在 是 Oracle 公司 对 其 源 代码 拥有 版 
权 。 该 公司 提供 双重 许可 方式 : 一 种 是 可 在 茶 些 常见 情境 下 遵循 GPL 的 免费 使 用 ， 另 一 种 
是 收费 的 商业 许可 证 。 同 一 软件 ， 却 有 两 种 不 同 的 许可 和 权限 。 有 关 GPL 的 细节 ， 可 在 其 
创造 者 自由 软件 基金 会 的 网 站 上 找到 (http://www .fsf.org/licenses/license-list.html) 。 


如 果 你 仅仅 使 用 MySQL 而 没有 重新 发 布 它 ， 又 或 者 是 重新 发 布 时 所 包含 的 软件 都 遵循 
GPL， 那 么 这 都 是 符合 GPL 的 ，Oracle 允许 你 这 么 做 。 你 其 至 可 以 在 重新 发 布 MySQL 时 
带 上 你 自己 开发 的 软件 ， 只 要 它 也 遵循 GPL 即 可 。 正 因 如 此 ，MariaDB 才 得 以 诞生 ， 并 
被 认可 为 MySQL 的 合法 分 支 。 

然而 ， 如 果 你 开发 了 一 个 依赖 MySQL 的 应 用 ， 并 希望 以 它 来 盘 利 ， 那 么 你 必须 向 Oracle 
购买 一 个 商业 许可 。 除 此 之 外 ， 还 有 其 他 一 些 情形 是 需要 商业 许可 的 。 详 情 请 浏览 
MySQL 法 律 网 页 (http://www.mysql.com/about/legal/)。 


除了 版 权 ，Oracle 还 拥有 MySQL 的 商标 。 因 此 ， 你 不 能 发 布 名 字 含 有 MySQL 的 软件 。 
这 些 对 于 学 习 使 用 MySQL 并 不 重要 ， 但 对 于 高 级 MySQL 开发 者 来 说 是 需要 注意 的 。 


2.3 获取 软件 


你 可 从 MySQL 网 站 (http://dev.mysql.com/downloads/mysql/) 或 镜像 站 (http://dev.mysql. 
com/downloads/mirrors.html) 获取 该 软件 ， 但 你 得 先 有 个 Oracle 账号 (免费 的 )。 你 也 可 以 
下 载 MariaDB， 它 包括 MySQL 的 最 新 功能 以 及 其 他 一 些 特性 。 它 在 MariaDB 基金 会 网 站 
(https://downloads.mariadb.org/mariadb/) 提供 下 载 ， 同样 ， 它 也 是 免费 的 ， 也 需要 先 注册 。 
这 两 个 网 站 在 下 载 的 过 程 中 ， 都 会 要 求 你 提供 个 人 信息 、 组 织 背 景 ， 以 及 把 该 软件 作 何 用 
途 。 这 些 信息 会 被 收集 到 它们 的 营销 部 门 。 但 你 也 可 以 表明 你 不 想 被 打扰 ， 仅 仅 下 载 完 就 
好 ， 不 用 再 与 他 们 打交道 。 

如 果 你 的 服务 器 或 本 地 计算 机 上 已 装 有 MySQL 或 MariaDB ， 那 么 你 可 以 跳 过 本 章 。 如 果 



























































































































































你 不 确定 有 没有 装 ， 在 Linux 或 Mac 上， 可 通过 命令 行 这 样 检查 
ps aux | grep mysql 
如 果 MySQL 在 运行 着 ， 你 会 看 到 类 似 下 面 的 结果 : 


2763 ? 00:00:00 mysqld_safe 
2900 ? 5-23:48:51 mysqld 


在 Windows 中 ， 你 可 用 tasklist 检查 。 只 需 在 命令 行 键入 : 
tasklist /fi "IMAGENAME eq mysqld" 
如 果 MySQL 在 运行 着 ， 你 会 看 到 类 似 下 面 的 结果 : 


Image Name PID Session Name Session# Mem Usage 


mysqld.exe 1356 Services 0 212 K 
如 果 没 有 运行 ， 则 会 看 到 这 样 的 信息 : 

INFO: No tasks are running which match the specified criteria. 
但 这 并 不 完全 保证 你 没有 安装 MySQL， 它 只 是 告诉 你 MySQL 的 守护 进程 没 在 运行 。 你 可 
用 文件 管理 器 之 类 的 工具 在 计算 机 中 搜索 mysqtd。 你 还 可 以 使 用 mysqladmin (假设 你 安装 
了 ) 来 检测 MySQL。 键 入 下 文 第 一 行 ， 你 会 看 到 接 下 来 的 结果 (示例 而 已 ) : 


mysqladmin -p version status 
























































mysqladmin Ver 9.0 Distrib 5.5.33a-MariaDB, for Linux on i686 
Copyright (c) 2000, 2013, Oracle, Monty Program Ab and others. 


Server version 5.5.33a-MariaDB 

Protocol version 10 

Connection Localhost via UNIX socket 

UNIX socket /var/lib/mysql/mysql.sock 
Uptime: 30 days 23 hours 37 min 12 sec 


Threads: 4 Questions: 24085079 Slow queries: 0 Opens: 10832 FLush tables: 3 
Open tables: 400 Queries per second avg: 8.996 Uptime: 2677032 Threads: 4 
Questions: 24085079 Slow queries: 0 Opens: 10832 FLush tables: 3 

Open tables: 400 Queries per second avg: 8.996 


如 果 你 从 以 上 测试 得 知 MySQL 已 运行 ,那么 你 可 以 跳 到 第 3 章 了 。 否 则 ， 你 可 能 需要 启 
动 它 。 具 体 做 法 会 在 2.5 而 中 各 小 市 末尾 处 介绍 。 你 需 找到 符合 你 的 MySQL 版 本 的 小 市 
(如 Mac OS X) ， 然 后 翻 到 小 节 末 尾 ， 看 如 何 启 动 守护 进程 。 然 后 试 着 启动 它 。 如 果 启 动 
成 功 ， 那 就 跳 到 本 章 末 尾 的 2.6 市 。 那 里 有 一 些 重点 关注 ， 包 括 安全 问题 。 如 果 启 动 不 了 ， 
那么 就 要 通读 符合 你 版 本 的 整 生 了。 


2.4 ”挑选 发 行 版 


在 下 载 之 前 ,请 先 想 好 要 安装 哪个 版 本 的 MySQL (或 MariaDB)。 对 于 MySQL 来 说 ， 最 
好 是 按照 Oracle 的 建议 ， 下 载 最 新 的 稳定 版 ， 即 正式 版 (GA)。 这 对 于 新 手 来 说 是 最 佳 先 
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择 。 初 学 者 不 要 磁 测 试 版 或 开发 版 。 除 非 你 有 Oracle 的 支持 ( 即 有 MySQL 企业 版 ) ， 否 
则 应 使 用 MySQL 社区 版 。 初 学 者 用 社区 版 和 企业 版 其 实 是 没什么 区 别 的 。 

对 于 MariaDB 来 说 ， 也 要 下 载 正 式 版 (https://downloads.mariadb.org/mariadb/) 。 

可 以 选择 用 源码 安装 或 用 二 进 制 执行 文件 安装 。 我 们 推荐 用 二 进 制 文件 安装 ， 因 为 这 比 
较 人 简单。 如 果 要 在 编译 或 安装 过 程 中 做 一 些 特别 设置 ， 又 或 者 是 没有 适合 你 的 操作 系统 
的 二 进 制 包 ， 则 要 选择 用 源码 安装 。 否 则 ， 就 用 二 进 制 文件 安装 吧 。 当 前 我 们 只 为 学 习 
MySQL 的 基础 知识 ， 没 必要 在 安装 上 花 太 多 工夫 。 


2.5 各 种 _AMP 


接 下 来 的 小 节 会 介绍 在 不 同 操作 系统 中 ， 以 不 同 的 方法 和 形式 下 载 和 安装 MySQL (或 
MariaDB ) 。 不 过 ， 有 个 简单 的 方法 ， 就 是 使 用 _AMP 包 。 这 个 缩写 代表 Apache、MySQL/ 
MariaDB 和 PHP/Perl/Python。 其 中 Apache 是 最 流行 的 Web 服务 器 ， 而 PHP 是 与 MySQL 
适 配 的 最 流行 的 编程 语言 。AMP 包 〈 栈 ) 基于 操作 系统 : Linux 的 叫 LAMP，Mac 的 叫 
MAMP，Windows 的 叫 WAMP。 安 装 AMP 包 时 ， 除 了 Apache、MySQL 和 了 PHP， 还 会 顺 
带 安装 上 相关 依赖 程序 。 这 种 做 法 很 便捷 ， 尽 管 你 还 是 需要 做 一 些 安装 后 的 调整 设置 (本 
章 最 后 一 节 会 介绍 ) 。 安 装 后 ， 你 就 直接 跳 到 2.6 节 吧 。 

刚才 所 说 的 包 ， 可 在 下 面 这 些 网 站 上 找到 。 


。 最 新 Linux 版 ， 请 看 Apache XAMPP 网 站 (多 出 的 P 是 指 Perl) : http:/www.apachefriends. 
org/en/xampp-linux.html。 尽 管 该 网 站 将 这 个 包 称 为 XAMPP 而 非 LAMPP， 但 其 实 是 一 
回 事 。 

。 最 新 Mac 版 ， 请 看 SourceForge MAMP 网 站 : http://sourceforge.net/projects/mamp/。 

。 最 新 Windows 版 ， 请 看 EasyPHP WAMP 网 站 : http://www.easyphp.org/download.php。 


它们 全 都 很 容易 安装 ， 采 用 默认 的 设置 通常 没什么 问题 。 


2.5.1 Linux 二 进 制 发 行 版 


如 果 你 的 服务 器 的 Linux 通过 RPM ( 红 帽 软件 包 管 理 器 ) 或 DEB (Debian Linux) 来 安装 
软件 ， 那 么 我 们 建议 你 使 用 二 进 制 包 而 非 源码 包 来 安装 MySQL。 以 下 系统 有 特定 的 二 进 
制 包 : RedHat、Debian 和 SuSE。 而 其 他 发 行 版 则 有 通用 的 包 。 另 外 ， 还 要 区 分 服务 器 的 
处 理 器 类 型 (例如 32 位 或 64 位 )。 


不 过 ， 在 继续 下 去 之 前 ， 如 果 你 有 Linux 原始 的 安装 盘 ， 那 么 你 可 以 直接 用 它 来 安装 
MySQL。 这 样 安装 完 的 话 ， 你 就 可 以 跳 到 2.6 节 ， 而 无 需 继续 阅读 本 节 后 面 的 内 容 了 。 但 
若 你 的 安装 盘 太 老 旧 (里 面 不 是 最 新 版 的 MySQL)， 你 可 能 需要 按照 接 下 来 介绍 的 方法 去 
安装 。 

所 有 版 本 的 MySQL， 都 提供 以 下 这 些 二 进 制 安装 包 的 下 载 : MySQL 服务 器 、 共 享 组 件 、 
兼容 亩 、 客 户 庙 工具、 嵌入 式 ， 以 及 测试 套件 。 其 中 最 重要 的 是 MySQL 服务 器 、 客 户 端 
工具 、 共 享 组 件 。 此 外 ， 你 可 能 还 想 安装 共享 库 。 若 想 使 用 PHP、Perl、C 之 类 的 编程 语 





































































































言 来 与 MySQL 进行 交互 ， 那 么 这 个 共享 库 就 是 必要 的 。 甚 他 包 服 务 于 那些 高 级 或 特殊 的 
需求 ， 本 书 不 作 介绍 ， 等 你 学 完 基本 的 内 容 再 说 到 。 

这 些 包 的 命名 规则 一 般 是 : MySQL-server-version.rpm，MySQL-client-version.rpm， 
MySQL-shared-version.rpm。 其 中 version 是 实际 的 版 本 号 。 供 Debian 安装 的 包 名 则 是 
以 .deb 结尾 ， 而 非 .rpm。 

安装 包 下 载 到 服务 器 上 之 后 ， 就 可 用 rpm 来 安装 了 ， 又 或 者 用 更 强大 的 工具 yum 来 安装 。 
yum 之 所 以 更 好 ， 是 因为 它 能 避免 你 安装 与 现 有 软件 冲突 的 东西 ， 自 动 帮 你 安装 上 缺失 的 
依赖 ， 还 能 检查 新 版 本 并 升级 。 对 Debian 系统 来 说 ， 类 似 的 工具 有 apt-get。Oracle 已 
为 MySQL 建立 了 yum 库 (http://dev.mysql.com/downloads/repo/yum/) 和 apt 库 (http:// 
dev.mysql.com/downloads/repo/apt/)。 而 MariaDB 则 有 对 应 各 系统 的 库 配 置 工 具 (https:/ 
downloads.mariadb.org/mariadb/repositories/) 。 

键入 类 似 以 下 的 命令 ， 用 yum 来 安装 MySQL 二 进 制 包 : 


yum instaLL MySQL-server-version.rpm \ 
MySQL-client-version.rpm MySQL-shared-version.rpm 


当然 ， 文 件 名 是 可 以 改 的 。yun 会 在 一 路 上 跟 你 确认 各 种 安装 、 移 除 、 冲 突 和 升级 问题 。 
除非 有 特殊 要 求 ， 否 则 你 可 以 按 默认 的 设置 进行 安装 。 
键入 类 似 以 下 的 命令 ， 用 yum 来 安装 MariaDB 二 进 制 包 : 

yum install MariaDB-server MariaDB-client 
在 含有 RPM 包 的 目录 里 ， 键 和 类似 以 下 的 命令 ， 用 rpm 来 安装 MySQL 或 MariaDB 二 进 
制 包 : 

rpm -ivh MySQL-server-version.rpm \ 

MySQL-client-version.rpm MySQL-shared-version.rpm 
如 果 服 务 器 上 已 安装 有 一 个 旧版 MySQL， 那 么 安装 过 程 就 会 报错 并 中 止 。 如 果 想 升级 ， 
你 可 用 -U 选 项 (大 写 ) 来 替换 -i: 


rpm -Uvh MySQL-server-version.rpm 

MySQL-client-version.rpm MySQL-shared-version.rpm 
RPM 文件 安装 好 后 ，mysqld 守护 进程 就 会 自动 启动 或 重启 。MySQL 安装 好 并 运行 后 ， 你 
还 需要 做 一 些 安装 后 的 调整 〈 在 2.6 节 中 有 详解 )。 所 以 ， 现 在 就 可 以 过 去 看 看 了 。 


2.5.2 Mac OS X 发 行 版 

以 前 Mac OS X 是 自 带 MySQL 的 ， 但 最 近 的 版 本 没有 (从 Oracle 接管 MySQL 开始 ) 。 如 
果 你 的 计算 机 运行 的 是 旧版 本 ， 那 么 就 可 能 已 经 安装 好 了 MySQL， 但 没 运 行 起 来 。 要 想 
检查 有 没有 安装 MySQL， 打 开 终 端 (在 应 用 /工具 中 )。 出 现 命 令 提示 符 后 ， 键 入 下 文 第 
一 行 〈 第 二 行 至 第 四 行 是 结果 ) : 


whereis mysql mysqLd mysqLd_safe 































































































/usr/bin/mysql 
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/usr/bin/mysqld 
/usr/bin/mysqld_safe 


若 结果 如 上 ， 那 就 是 安装 了 。 接 着 检查 MySQL 守护 进程 (mysqLd) 有 没有 运行 ， 键入: 
ps aux | grep mysql 

如 果 mysqtLd 在 运行 ， 那 就 没 必 要 再 装 了 ， 请 跳 到 2.6 节 。 

如 果 没 在 运行 ， 输 入 以 下 命令 ， 以 root 身份 启动 它 : 
/usr/bin/mysqld_safe & 


如 果 你 的 Mac 上 没 装 过 MySQL 或 者 想 升 级 ， 那 么 接着 看 本 节 。 对 于 没 安装 的 人 来 说 ， 
你 需要 在 装 之 前 先 创建 一 个 叫 mysql 的 用 户 。 而 Oracle 的 MySQL 包 会 自动 创建 _mysql 
用 户 。 

我 们 可 通过 Mac 的 DMG 文件 来 安装 MySQL。 对 于 没有 GUI 或 桌面 管理 器 的 Mac 服务 
器 , 或 需要 远程 操作 的 情况 , 可 用 TAR 文件 来 安装 *。 不 管 你 是 下 载 DMG 还 是 TAR 文件 ， 
都 应 注意 处 理 器 类 型 要 求 (如 32 位 或 64 位 )， 以 及 操作 系统 的 版 本 要 求 (如 Mac OS X 
10.6 或 以 上 )。 


如 果 装 有 旧版 MySQL， 你 就 需要 在 安装 、 运 行 新 版 MySQL， 或 替换 成 MariaDB 之 前 ， 先 
将 其 关 掉 。 为 此 ， 你 可 以 使 用 MySQL 管理 器 ， 它 是 一 个 GUI 程序 ， 可 能 会 跟随 MySQL 
一 起 安装 。 最 近 的 Mac OS X 一 般 都 有 它 。 如 果 你 没有 MySQL 管理 器 ， 则 需要 键入 以 下 
命令 来 关 掉 MySQL : 


/usr/sbin/mysqladmin -u root -p shutdown 


如 果 你 从 没 用 过 MySQL， 也 没 设置 过 密码 ， 那 么 密码 应 该 是 空 的 。 当 你 键入 上 述 命 令 后 ， 
被 要 求 输入 密码 时 ， 直 接 敲 Enter 键 即 可 。 

要 想 安装 MySQL 包 ， 可 从 Finder 双击 你 下 载 的 镜像 文件 (DMG)， 这 会 打开 里 面 的 内 容 。 
然后 查找 PKG 文件 ， 正 常 来 说 会 有 两 个 。 双 击 名 为 mysql-version.pkg 的 那个 (如 mysql- 
5.5.29-osx10.6-x86.pkg)。 这 就 开始 安装 了 。 对 大 多 数 用 户 和 开发 者 来 说 ， 安 装 过 程 一 切 按 
默认 设置 即 可 。 

若 要 MySQL 开机 时 启动 ， 可 加 上 启动 项 。 在 你 下 载 的 DMG 中 ， 有 个 MySQLStartupItem. 
pkg。 双 击 它 ， 即 可 为 MySQL 建立 一 个 启动 项 。 你 还 应 该 安装 一 个 MySQL 偏好 窗 格 ， 以 
便 能 从 Mac 的 系统 偏好 中 启动 和 关闭 MySQL， 或 设置 其 是 否 开机 自 启 。 为 此 你 需要 点 击 
MYySQL.prefPane。 如 果 安 装 有 问题 ， 可 参考 DMG 里 的 ReadMe.txt。 

Mac 现在 还 没有 MariaDB 的 官方 安装 工具 。 不 过 你 可 以 用 homebrew (http://brew.sh/) 来 
下 载 和 安装 所 需 的 包 (其 中 包括 所 需 的 库 )。Mac 的 homebrew 如 同 Linux 的 yum。 装 好 
homebrew 后 ， 你 就 能 使 用 以 下 命令 来 安装 MariaDB 了 : 


brew install mariadb 



















































































注 2: tar 是 出 自 Unix 的 归档 工具 ， 但 很 多 系统 上 的 很 多 归档 工具 都 能 识别 这 种 文件 格式 。 
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想 用 TAR 而 非 DMG 来 安装 的 话 ， 先 从 Oracle 网 站 下 载 TAR， 然 后 将 其 移 到 /usr/local 目 
录 ， 并 进入 该 目录 。 接 着 ， 这 样 解 包 : 

cd /usr/local 

tar xvfz mysql-version.tar.gz 
上 述 文件 名 请 按 实 际 情况 填写 。 然 后 ， 为 该 安装 目录 创建 一 个 软 连接 ， 并 执行 设置 程序 。 
以 下 是 例子 : 


ln -s /usr/local/mysql-version /usr/local/mysql 
cd /usr/local/mysql 























./configure --prefix=/usr/local/mysql \ 
--with-unix-socket-path=/usr/local/mysql/mysql_socket \ 
--with-mysqld-user=mysql 


第 一 行 命令 创建 软 连接 是 不 带 版 本 号 的 ， 而 源 目 录 是 有 版 本 号 version 的 (请 按 实际 情况 
填写 )。 为 源 目录 加 上 版 本 号 ， 比 较 方便 日 后 查找 。 当 然 你 也 可 以 不 加 版 本 号 ,但 这 样 很 
难 管理 新 旧版 本 的 目录 。 

第 二 行 命令 会 使 你 跳 转 到 安装 目录 。 第 三 行 命令 运行 配置 程序 安装 MySQL。 这 里 我 已 经 
加 入 了 一 些 有 助 于 解决 疑难 的 选项 。 按 个 人 需要 ， 你 也 可 以 加 上 更 多 选项 ， 但 对 于 大 多 数 
新 手 来 说 ， 这 些 就 够 了 。 
然后 ， 你 还 要 设置 这 些 文件 和 目录 的 所 有 者 ， 以 及 组 权限 。 用 户 和 组 都 设 为 nysql， 它 们 
应 该 在 安装 时 就 被 建 好 了 。 对 于 某 些 系统 ， 可 能 需要 先 用 vsdbutil 来 开放 硬盘 和 卷 的 权 
限 。 如 果 想 先 检查 一 下 ， 可 用 -c 选 项 。 如 果 想 直接 开放 ， 用 -a 选项 。 另 外 你 还 需要 在 / 
usr/bin 中 建立 mysql 和 mysqLadmin 的 软 连 接 : 


vsdbutil -a /Volumes/Macintosh\ HD/ 





























sudo chown -R mysql /usr/\local/mysql/. 


alias mysql=/usr/local/mysql/bin/mysql 

alias mysqladmin=/usr/local/mysql/bin/mysqladmin 
上 例 第 一 行 用 于 开放 Mac 的 主 驱动 器 的 权限 。 当 然 ， 你 安装 MySQL 的 位 置 可 能 不 叫 
Macintosh HD。 第 二 行 用 于 改变 所 有 者 。 最 后 两 行 用 于 创建 别名 ， 以 便 你 能 从 任何 目录 运 
行 它们 。 
现在 ， 你 应 该 已 经 可 以 启动 守护 进程 ， 并 登录 进 MySQL (或 MariaDB) 了 。 如 果 你 安装 
了 MySQL 偏好 窗 格 ， 还 可 以 通过 系统 偏好 来 启动 。 

sudo /usr/bin/mysqLd_safe & 

mysql -U root -p 
对 于 不 同 版 本 的 MySQL， 安 装 dmg 的 路 径 (上 例 第 一 行 ) 可 能 会 不 一 样 。& 符号 用 于 
将 进程 放 在 后 台 和 运行。 第 二 行 开启 mysql 客户 端 并 让 你 以 root 身份 登录 ， 这 个 root 是 
MySQL 的 最 高 级 管理 员 ， 与 操作 系统 的 root 无 关 。 该 命令 要 求 你 输入 密码 ， 但 密码 应 该 
是 空 的 ， 所 以 直接 按 Enter 键 即 可 登录 。 
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成 功 的 话 ， 就 说 明 你 已 经 正确 设置 了 mysql 软 连接 ， 并 能 连接 MySQL (或 MariaDB ) 。 
在 正式 使 用 之 前 ， 我 们 还 有 一 些 事情 要 做 。 所 以 ， 先 输入 exit 并 按 Enter 键 ， 退 出 
mysql 吧 。 


现在 MySQ (或 MariaDB) 已 然 装 好 ， 请 参阅 2.6 市 ， 做 安装 后 的 调整 。 





2.5.3 ” Windows 发 行 版 


在 Microsoft Windows 服务 器 上 安装 MySQL 或 MariaDB 相当 简单 。 你 可 从 MySQL 网 站 
找到 各 种 安装 方式 和 版 本 ， 下 载 的 安装 包 包含 所 有 相关 组 件 。MariaDB 基金 会 网 站 也 有 
提供 用 于 Windows 服务 器 的 安装 包 。 最 简单 的 做 法 就 是 下 载 并 使 用 MySQL Istaller for 
Windows。 它 会 帮 你 搞定 一 切 。 旧 版 本 以 TAR 文件 方式 提供 ， 而 Installer 的 方式 更 方便 ， 
而 且 是 最 新 版 。 无 论 是 TAR 还 是 Installer， 都 分 32 位 和 64 位 ， 你 需要 按 自 己 服务 器 处 理 
器 的 类 型 来 选择 。 

Installer 和 TAR 都 含有 MySQL (或 MariaDB) 的 必要 文件 ， 包 括 本 书 提 及 的 所 有 命令 行 
工具 (如 mysql、mysqladmin、mysqlbackup)， 适 用 于 特殊 任务 的 便利 脚本 ， 以 及 一 些 API 
库 。 它 们 还 为 你 提供 了 对 应 版 本 的 /usr/local/mysql/docs。 


如 果 你 打算 用 TAR 来 安装 ， 就 要 在 开始 时 额外 做 一 些 人 工 操 作 ， 因 为 它 不 像 Installer 那 
么 智能 。 首 先 ， 解 压缩 该 TAR 文件 ， 以 得 到 里 面 的 安装 文件 。 这 一 步 需要 你 先 在 机 器 
上 安装 有 WinZip (http://www.winzip.com) 之 类 的 解压 工具 。 然 后 ， 把 安装 文件 复制 到 
ci\mysql。 如 果 没 有 这 个 目录 ， 那 么 你 还 需要 自己 去 建立 。 再 使 用 文本 文件 编辑 器 (如 
Notepad) ， 在 c:\windows 中 建立 配置 文件 ， 一般 名 为 my.ini。 配 置 文件 的 样 例 在 TAR 中 可 
找到 。 这 些 文件 都 放 好 后 ， 就 可 以 启动 stup 了。 虽然 它 也 很 自动 ， 但 还 是 不 如 Installer。 
如 果 你 的 服务 器 上 已 经 有 MySQL 并 且 在 运行 了 ， 而 你 想 安装 一 个 新 版 本 ， 那 么 在 启动 
Installer 或 setup 之 前 ， 你 得 先 关 掉 原 本 那个 。 在 server 版 的 Windows 上 ，MySQL 通常 就 
是 一 个 服务 。 你 可 以 在 命令 窗口 中 输入 如 下 命令 来 关闭 并 移 除 它 : 

mysqld -remove 
如 果 它 不 是 作为 服务 而 运行 着 ， 那 就 用 以 下 命令 来 关 掉 它 : 

msyqladmin -uy root -p shutdown 
如 果 报 错 的 话 ， 你 可 能 需要 搞 清楚 mysqtadmin 的 绝对 路 径 ， 然 后 改 成 这 样 ; 

"C:\Program Data\MySQL\MySQL Server 5.1\bin\mysqladmin" -u root -p shutdown 
下 载 好 Installer 之 后 ， 只 需 双 击 该 图 标 即 可 启动 。 而 对 于 ZIP， 则 是 双击 解压 的 setup.exe。 
它们 接 下 来 的 运作 基本 一 样 。 
开始 安装 并 确认 许可 问题 之 后 ， 它 会 让 你 选择 安装 类 型 。 一 般 推荐 开发 者 选项 。 但 它 并 不 
包含 API 和 一 些 工具 。 它 只 会 安装 MySQL 服务 器 、 库 以 及 几 个 客户 端 。 通 常 这 是 最 佳 选 
择 。 虽 然 MySQL 体积 也 不 大 ， 但 如 果 你 平时 是 从 其 他 桌面 远程 操作 这 人 台 服 务 器 的 话 ， 那 
么 你 可 以 选择 “只 安装 服务 器 ”， 使 其 在 服务 器 上 安装 MySQL 服务 器 。 然 后 在 其 他 桌面 选 
择 “只 安装 客户 端 ”。 你 也 可 以 在 服务 器 上 选 “ 只 安装 服务 器 " ， 另 外 在 桌面 安装 开发 包 。 
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这 样 能 方便 你 在 桌面 上 完成 开发 测试 后 ， 才 将 应 用 发 布 到 服务 器 。 选 择 搭配 请 结合 自身 实 
际 情况 。 最 起 码 要 安装 好 MySQL 服务 器 和 客户 端 ， 以 使 你 能 连 上 数据 库 。 

在 选择 安装 类 型 的 同时 ， 你 还 要 选 两 个 文件 路 径 : 一 个 放 工 具 ， 另 一 个 放 数 据 文 件 。 你 可 
以 按 默认 ， 也 可 以 自 定 义 到 其 他 驱动 器 或 位 置 。 通 常 默 认 设置 就 很 好 。 记 得 把 路 径 复制 出 
来 ， 因 为 你 以 后 可 能 需要 翻 查 。 虽 然 在 配置 文件 中 也 有 ， 但 现在 方便 就 现在 复制 吧 ， 省 得 
你 以 后 再 找 。 

接着 ，Installer 会 检查 你 的 机 器 上 有 没有 缺少 必要 的 文件 。 不 管 它 要 装 什 么 ， 都 让 它 装 就 
是 了 。 而 TAR 方式 的 文件 路 径 选 择 ， 一 般 是 C:\Program DataNMySQL\ 放 程 序 ，C:\Program 
DataMMySQLIMySQL Server version\data\ 放 数 据 ， 其 中 version 是 你 实际 的 版 本 号 。 


Installer 结束 之 前 ， 还 会 出 现 一 个 设置 界面 。 如 果 需 要 ， 你 可 以 点 击 “高 级 设置 "， 但 因为 
你 是 初学 ， 所 以 最 好 还 是 不 点 ， 让 它 按 默认 的 设置 来 。 其 实 设置 是 可 以 日 后 改动 的 。 
如 有 果 你 的 安装 含有 MySQL 服务器， 你 会 看 到 “开机 启动 MySQL ”的 勾 选 框 。 我 们 建议 打 
勾 。 而 在 配置 那 一 步 中 ， 你 可 以 为 root 设置 密码 。 设 置 密码 要 谨慎 ， 并 牢 牢 记 住 。 你 还 可 
以 在 此 添加 其 他 用 户 。 添 加 用 户 会 在 2.6 节 中 介绍 。 但 如 果 你 想 简单 一 点 ， 也 可 以 在 这 一 
步 里 添加 一 一 不 过 我 还 是 建议 用 安装 后 的 MySQL 来 添加 ， 因 为 那 才 是 常用 技能 。 剩 下 的 
选项 ， 采 用 默认 设置 就 行 了 。 

本 书 使 用 命令 行 来 教学 ， 所 以 你 要 时 时 都 能 方便 地 找到 命令 行 。 为 了 能 在 任何 目录 中 开启 
命令 行 工具 ， 输 入 以 下 语句 : 


PATH=%PATH%; C:\Program Data\MySQL\MySQL Server version\bin 
export PATH 


把 version 替换 成 实际 的 版 本 号 ， 并 注意 路 径 要 准确 。 如 果 改 过 默认 路 径 ， 请 用 改 后 的 。 
上 例 使 你 输入 mysql 即 可 打开 客户 端 ， 而 不 用 每 次 都 写 一 大 串 的 C:\Program DataMySQI\ 
MySQL Server versionbinmysql。 注 意 某 些 Windows 版 本 的 路 径 是 以 C:\Program Files\ 开 
头 的 。 可 执行 文件 的 具体 路 径 可 搜索 bin\。 已 经 打开 的 命令 行 窗 口 是 不 会 歼 得 这 个 新 路 会 
的 ， 你 需要 开 个 新 的 窗口 来 检查 看 看 。 
Installer 会 在 完成 安装 并 建立 好 配置 文件 后 ， 自 动 开启 MySQL。 手 动 安装 的 人 ， 要 这 样 来 
启动 : 

mysqld --install 

net start mysql 


现在 MySQL 已 经 装 好 并 且 在 运行 了 ， 请 跳 到 本 章 2.6 节 ， 做 一 些 后 期 调整 。 










































































2.5.4 FreeBSD 和 Sun Solaris 发 行 版 


MySQL 或 MariaDB 的 二 进 制 包 比 源码 包 更 易 安装 。 如 果 你 的 平台 有 相应 的 二 进 制 安装 包 ， 
那 请 使 用 它 。 对 于 Sun Solaris 来 说 ，Oracle 网 站 提供 了 MySQL 的 PKG 文件 ，MariaDB 基 
金 会 网 站 提供 了 MariaDB 的 PKG 文件 。MySQL 需要 根据 你 的 处 理 器 区 分 32 位 、64 位 和 
SPARC。MariaDB 则 只 有 64 位 版 本 。 
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TAR 包 也 是 有 的 。FreeBSD 方面 则 只 有 MySQL 的 TAR; 想 安 装 MariaDB ， 你 需要 自己 编 
译 源 码 。 下 载 的 TAR 需要 用 GNU 的 tar 和 gunzip 来 解压 出 安装 文件 。 这 两 个 工具 通常 
已 置 于 Sun Solaris 和 FreeBSD 中 。 如 果 没 有 ， 你 可 从 GNU 基金 会 网 站 (http://www.gnu. 
org) 下 载 。 

挑 好 并 下 载 好 安装 文件 后 ， 以 root 身份 运行 以 下 命令 来 开始 安装 : 


groupadd mysql 

Useradd -g mysql mysql 

cd /usr/local 

tar xvfz /tmp/mysql-version.tar.gz 


上 述 命 令 同 时 适用 于 MySQL 和 MariaDB。 第 一 行 创建 名 为 mysql 的 用 户 组 。 第 二 行 创建 
用 户 mysql， 并 将 其 加 到 mysql 组 中 。 第 三 行 转 到 用 于 解压 MySQL 的 目录 。 最 后 一 行 用 
tar (加 上 -z 以 使 用 gunzip) 来 解压 和 提取 安装 文件 。version 处 请 填 实 际 版 本 号 ， 也 就 
是 说 ， 使 用 你 下 载 得 到 的 文件 的 名 字 和 实际 的 文件 路 径 ， 作 为 tar 的 第 二 个 参数 。 在 Sun 
Solaris 上 ， 请 用 gtar 替换 tar。 

执行 上 述 命令 之 后 ， 接 着 为 创建 出 的 目录 建立 软 连 接 : 


ln -s /usr/local/mysql-version /usr/LocaL/mysqL 












































这 会 使 /usr/local/mysql 指向 /usr/local/mysql-version， 其 中 mysql-version 是 刚刚 tar 释放 
出 的 目录 。 这 么 做 是 有 必要 的 ， 因 为 MySQL 会 默认 从 /usr/local/mysql 找 执行 文件 ， 而 从 / 
usr/local/mysql/data 找 数 据 文件 。 

现在 ，MySQL (或 MariaDB) 已 经 基本 上 安装 好 了 。 接 下 来 要 生成 初始 的 用 户 权限 或 对 表 
进行 授权 ， 以 及 改变 相关 程序 和 数据 文件 的 所 有 权 : 


cd /usr/LocaL/mysqL 
./scripts/mysql_install_db 











chown -R mysql /usr/local/mysql 

chgrp -R mysql /usr/local/mysql 
第 一 行 命令 先 跳 到 MySQL 所 在 的 目录 。 第 二 行使 用 发 行 版 自 带 的 脚本 ， 生 成 初始 的 用 
户 权 限 或 对 表 进 行 授 权 ， 包 括 建立 MySQL 的 超级 用 户 root。 这 在 MariaDB 中 也 是 
一 样 的 。 第 三 行将 MySQL 目录 和 项 目的 所 有 者 改 为 mysql。 最 后 一 行将 该 目录 的 组 改 为 
mysql。 
安装 好 程序 并 设置 好 权限 后 ， 就 可 以 启动 MySQL 了 。 这 有 好 几 种 做 法 。 为 保证 守护 进程 
能 在 崩溃 后 自动 重启 ， 使 用 下 面 这 个 命令 ; 

/usr/local/mysql/bin/mysqld_safe & 


此 命令 所 启动 的 mysqld_safe 守护 进程 ， 会 发 起 MySQL 服务 器 守护 进程 ii = 
mysqld 崩溃 ，mysqld_safe 就 会 重启 它 。 结 尾 的 & 符号 能 使 整 条 命令 在 后 台 运行 。 这 样 你 
登 出 服务 器 后 ，MySQL 也 依然 会 继续 运行 。 
想 要 MysQL (或 MariaDB) 开机 启动 ， 可 将 /usr/local/mysql/support-files 的 mysql.server 文 
件 复制 到 /etc/init.d 中 。 你 会 用 到 以 下 命令 : 
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cp support-files/mysql.server /etc/init.d/mysql 
chmod +x /etc/init.d/mysql 
chkconfig --add mysql 


第 一 行 是 惯例 做 法 ， 将 启动 文件 放 到 服务 器 的 守护 进程 初始 化 目录 ， 并 改名 为 mysqL。 第 
二 行使 该 文件 可 执行 。 第 三 行将 其 启动 级 别 定 为 开机 和 关机 。 














调整 。 


2.5.5 源码 包 


尽管 我 们 推荐 使 用 二 进 制 包 来 安装 MySQL 和 MariaDB ， 但 有 时 你 还 是 会 想 用 源码 包 ， 也 
许 是 因为 没有 适合 你 的 操作 系统 的 二 进 制 包 ， 又 或 者 是 你 有 特别 需求 而 要 修改 安装 文件 。 
在 类 Unix 系统 (包括 Linux、FreeBSD 和 Sun Solaris) 上 安装 源码 包 的 步骤 基本 上 是 一 样 
的 。 本 小 节 会 讲解 这 些 步骤 。 


在 安装 源码 包 之 前 ， 你 得 先 准备 好 GNU 的 gunzip、tar、gcc (v2.95.2 或 以 上 ) 和 make。 
Linux 系统 和 大 多 数 Unix 系统 一 般 都 带 有 这 些 工 具 。 如 采 没 有 ， 请 从 GNU 基金 会 网 站 
(http://www.gnu.org) 下 载 。 


挑选 并 下 载 好 源码 包 后 ， 在 你 想 要 释 出 源码 的 目录 ， 以 root 执行 以 下 命令 : 


groupadd mysql 

useradd -g mysql mysql 

tar xvfz /tmp/mysql-version.tar.gz 
cd mysql-version 


以 上 命令 也 适用 于 安装 MariaDB， 只 是 名 字 需 要 改 成 mariadb-5.5.35.tar.gz 之 类 ， 从 TAR 
释 出 的 目录 名 也 会 有 所 不 同 。 第 一 行 创建 组 mysql。 第 二 行 创建 用 户 mysql， 同 时 将 其 加 到 
mysql 组 。 下 一 条 命令 使 用 tar (加 上 -z 以 使 用 gunzip) 来 解压 和 提取 源码 。version 请 
填 实 际 版 本 号 。 第 二 个 参数 的 文件 路 径 和 名 字 也 请 按 实际 情况 填写 。 最 后 一 条 命令 跳 转 到 
刚刚 解压 出 的 目录 。 该 目录 包含 了 配置 MySQL 的 必要 文件 。 
下 一 步 ， 设 置 源 码 文件 以 便 构 建 出 二 进 制 文件 。 这 一 步 里 你 可 以 根据 特殊 需求 来 加 入 自 定 
义 的 一 些 东 西 。 比 如 说 ， 你 想 改变 默认 安装 目录 ， 可 以 使 用 --prefix 选项 来 指定 。 想 改变 
Unix 套 接 字 文 件 的 路 径 ， 可 以 用 --with-unix-socket-path 指定 。 如 果 你 不 想 使 用 默认 的 
latin1 字符 集 ， 可 以 用 - -with-charset 另 作 指 定 。 以 下 是 上 述 需求 的 示例 : 
./configure --prefix=/usr/local/mysql \ 

--with-unix-socket-path=/tmp \ 

--with-charset=lLatin2 
你 可 以 一 行 打 完 而 不 用 反 斜 线 。 除 此 之 外 ， 还 有 其 他 配置 选项 。 想 获知 全 部 ， 可 用 此 
命令 : 


./configure --help 









































又 或 者 参考 “编译 MySQL” 的 网 上 文档 (http://dev.mysql.com/doc/reftman/5.6/en/compilation- 
problems.html) 。 
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决定 好 配置 什么 后 ， 就 可 以 用 该 脚本 来 执行 了 。 它 运行 起 来 会 花 一 些 时 间 ， 并 打印 出 一 大 
堆 信 息 ， 如 果 最 后 成 功 结束 的 话 ， 那 么 这 些 信息 是 可 以 不 用 看 的 。 结 束 之 后 ， 我 们 开始 构 
建 二 进 制 文件 ， 以 及 初始 化 MySQL: 

make 

make install 

cd /usr/LocaL/mysqL 

./scripts/mysql_install_db 
第 一 行 构建 二 进 制 文件 。 它 跟 第 二 行 都 会 输出 大 量 信 息 ， 这 里 为 了 市 省 空间 就 不 印 出 来 
了 。 成 功 后 ， 执 行 第 二 行 ， 以 安装 二 进 制 文件 和 相关 目录 里 的 文件 。 第 三 行 跳 到 安装 目 
录 。 如 果 你 改过 安装 目录 ， 那 请 填 新 目录 。 最 后 一 行使 用 安装 好 的 脚本 ， 来 做 用 户 和 表 的 
权限 初始 化 设置 。 


剩 下 要 做 的 就 是 更 改 程序 和 目录 的 权限 : 

chown -R mysql /usr/LocaL/mysqL 

chgrp -R mysql /usr/LocaL/mysqL 
第 一 行将 MySQL 程序 和 目录 的 所 有 者 改 为 mysql。 第 二 行将 组 改 为 mysql。 其 中 的 文件 路 
径 会 因 MySQL 版 本 不 同 而 异 ， 如 果 你 改变 过 配置 ， 那 么 也 会 不 一 样 。 
都 完成 之 后 ， 就 可 以 启动 守护 进程 了 。 这 里 做 法 也 有 多 种 。 为 保证 守护 进程 能 在 月 涡 后 自 
动 重启 ， 使 用 以 下 命令 : 

/usr/LocaL/mysqL/bin/mysqLd_safe & 


此 命令 对 MySQL 和 MariaDB 都 适用 ， 它 局 动 的 nysqLd_safe 守护 进程 会 发 起 服务 器 守护 
进程 mnysqLd。 一 旦 mysqld 崩溃 ，mysqLd_safe 就 会 重启 它 。 结 尾 的 & 符号 能 使 整 条 命令 在 
后 台 和 运行。 这样 你 登 出 服务 器 后 ，MySQL 也 依然 会 继续 运行 。 
想 要 MysQL 或 MariaDB 开机 启动 ， 可 将 /usr/local/mysql/support-files 的 mysql.server 文件 
复制 到 /etc/init.d 中 。 你 会 用 到 以 下 命令 : 

cp support-files/mysql.server /etc/init.d/mysql 

chmod +x /etc/init.d/mysql 

chkconfig --add mysql 
第 一 行 是 惯例 做 法 ， 将 启动 文件 放 到 服务 器 的 守护 进程 初始 化 目录 ， 并 改名 为 mysql。 第 
二 行使 该 文件 可 执行 。 第 三 行将 其 启动 级 别 定 为 开机 和 关机 。 
这 样 MySQL (或 MariaDB) 就 安装 好 并 且 能 运行 了 。 接 着 请 到 下 一 节 看 看 怎样 做 一 些 后 
期 调整 。 


mm 志士 
2.6 ”安装 后 
安装 好 MySQL 或 MariaDB 后 ， 在 让 别人 使 用 之 前 ， 还 有 一 些 事情 要 做 。 例 如 ， 可 能 你 会 


想 修改 配置 。 或 者 至 少 ， 你 会 想 改变 root 的 密码 ， 还 要 创建 一 些 非 管理 员 的 用 户 。 茶 些 版 
本 的 MySQL 会 预先 提供 一 些 匿 名 用 户 ， 那 些 你 应 该 删 掉 。 本 节 将 会 介绍 这 些 任务 。 



































人 一， 















































尽管 MySQL 和 MariaDB 的 作者 已 经 给 出 了 推荐 的 配置 ， 但 你 或 许 会 做 一 些 个 性 化 设置 。 
例如 ， 开 启 错误 日 志 功 能 。 


2.6.1 特殊 配置 


想 要 开启 错误 日 志 之 类 的 功能 ， 你 需要 修改 MySQL 的 主 配置 文件 。 在 类 Unix 系统 中 ， 它 
是 /etc/my.cnf。 在 Windows 中 ， 则 是 C:\windows\my.ini 或 者 C:\my.cnf。 主 配置 文件 应 该 
用 文本 文件 编辑 器 来 修改 一 一 切 勿 用 文字 处 理 软件 ， 那 样 会 引入 隐 含 的 二 进 制 字符 ， 这 将 
导致 一 些 问题 。 


配置 文件 被 分 成 多 个 小 节 (小 组 ) ， 每 节 前 面 都 有 一 个 用 方 括号 括 起 来 的 标题 。 例 如 服务 
器 守护 进程 的 设置 在 [mysqld] 之 下 。 在 此 标题 下 ， 你 可 以 加 入 类 似 Log=/var/Log/mysqLl 的 
东西 ， 以 设置 日 志文 件 的 路 径 ， 并 激活 日 志 功 能 。 一 节 里 可 以 有 很 多 配置 项 。 以 下 是 一 个 
样板 


[mysqld] 

datadir=/data/mysql 

user=mysql 
default-character-set=utf8 
log-bin=/data/mysql/logs/binary_log 
max_allowed_packet=512M 





[mysqLd_safe] 

ulimit -d 256000 
Ledir=/usr/sbin 

mysqld=mysqld 
log-error=/var/\log/mysqld.log 
pid-file=/data/mysql/mysqld.pid 


[mysql.client] 
default-character-set=utf8 


新 手 可 能 不 需要 改动 配置 。 暂 时 你 只 需要 知道 这 个 配置 文件 的 存在 与 所 在 ， 以 及 如 何 修改 
它 。 最 重要 的 是 修改 root 的 密码 ， 因 为 它 起 初 是 空 的 。 


2.6.2 ”给 root 设 置 初始 密码 
改变 root 密码 的 方法 有 多 种 。 其 中 一 种 是 使 用 管理 工具 mysqLadmin : 

mysqladmin -U root -p flush-privileges password "new pwd" 
new_pwd 处 请 替换 成 一 个 强 密码 。 如 果 你 得 到 类 似 “mysqladmin command is not found” 的 
提示 ， 可 能 是 因为 你 没有 为 MySQL 的 目录 创建 软 连接 ， 或 者 是 该 目录 不 在 PATH 中 。 
那么 请 参照 前 面相 应 发 行 版 里 介绍 的 做 法 来 修正 。 或 者 你 可 使 用 完整 路 径 。 在 Linux 或 
类 Unix 系统 上 ， 试 着 运行 /usr/tocal/mysql/bin/mysqladmin。 在 Windows 上 ， 试 试 c:\ 
mysql\bin\mysqladmin, 
不 过 ， 如 果 你 是 在 一 台 联 网 的 机 器 上 操作 ， 最 好 还 是 别 用 这 个 命令 来 修改 ， 因 为 可 能 有 人 
通过 偷 看 或 者 翻 查 服务 器 日 志 来 窃取 密码 。 对 于 v5.5.3 的 MySQL， 你 可 以 这 么 做 : 
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mysqladmin -u root -p flush-privileges password 


执行 这 条 命令 之 后 ， 它 会 提示 你 输入 旧 密 码 ， 因 为 初始 是 空 的 ， 所 以 直接 按 Enter 键 。 接 
着 它 会 两 次 提示 你 输入 新 密码 。 这 种 方法 不 会 将 你 的 密码 显示 在 屏幕 上 。 如 果 一 切 都 安装 
好 了 并 且 mysqtd 在 运行 着 ， 那 么 输 完 以 后 应 该 是 不 会 出 现任 何 信息 的 。 


MySQL 的 root 跟 操作 系统 的 root 是 完全 不 同 的 两 个 概念 (虽然 名 字 一 样 )。 它 只 在 
MySQL 和 MariaDB 中 有 意义 。 在 本 书 所 有 地 方 ， 当 我 说 root 时 ， 一般 就 是 指 MySQL 的 
root。 当 要 说 操作 系统 的 root 时 ， 我 会 特别 指出 。 


2.6.3 关于 密码 的 更 多 问题 ， 以 及 删除 匿名 用 户 


MySQL 中 的 权限 是 根据 用 户 名 和 主机 来 决定 的 。 例 如 ， 从 localhost 登录 的 root 被 允许 做 
任何 事 ， 但 远程 登录 的 就 做 不 了 什么 。 这 是 为 了 安全 着 想 。 所 以 ，root 的 用 户 名 与 主机 的 
组 合 就 有 好 几 种 。 因 为 你 刚才 是 登录 到 服务 器 上 ， 再 使 用 mysqLadmin 来 改 密码 的 ， 所 以 密 
码 对 应 的 是 rooylocalhost。 接 着 你 要 给 剩 下 的 组 合 设置 密码 。 想 查看 所 有 组 合 ， 可 用 以 下 






































mysql -uy root -p -e "SELECT User,Host FROM mysql.user;" 


| root | 127.0.0.1 | 
| root | localhost | 
| root | % | 
| | localhost 

















如 果 运 行 不 了 ， 可 能 是 你 的 PATH 中 没有 mysql。 那 就 要 在 前 面 加 上 /bin/ 或 者 /usr/ 
bin/， 或 其 他 安装 路 径 。MariaDB 也 是 用 这 个 命令 。 这 结果 是 我 编 出 来 的 ， 你 实际 看 到 的 
会 不 一 样 。 
很 多 版 本 的 MySQL 都 含有 root 和 % 的 组 合 ， 其 中 % 是 指 任何 主机 。 这 就 不 安全 了 ， 因 为 
它 允 许 人 们 从 各 种 地 方 通过 root 连接 MySQL。 另 外 也 有 很 多 版 本 的 MySQL 含有 空 用 户 
名 加 上 Locathost 的 组 合 ， 即 任何 用 户 名 都 可 从 localhost 登录 。 这 就 是 匿名 用 户 。 尽 管 
用 户 已 经 存在 ， 但 初始 密码 都 是 空 的 。 你 要 做 的 是 删 掉 没 用 的 用 户 ， 并 给 留 下 的 设置 密 
码 。 尽 管 127.0.0.1 和 localhost 对 应 的 是 同一 个 主机 ， 但 你 还 是 要 分 两 次 来 改 密码 。 对 
于 上 面 的 查询 结果 ， 若 要 给 前 两 条 组 合 改 密码 ， 并 删 掉 后 两 条 组 合 ， 你 可 在 命令 提示 符 执 
行 以 下 命令 : 









































mysql -U root -p -e "SET PASSNORD FOR 'root'@'127.0.0.1' PASSWORD('new pwd' );" 
mysql -U root -p -e "SET PASSWORD FOR 'root'@'localhost' PASSWORD('new pwd' );" 
mysql -U root -p -e "DROP USER 'root'@'%';" 

mysql -U root -p -e "DROP USER ''@'localhost';" 


当 你 修改 完 这 第 一 批 用 户 后 ， 得 用 以 下 命令 刷新 一 下 ， 以 使 密码 生效 : 


mysqladmin -u root -p flush-privileges 
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从 此 以 后 ，root 就 得 用 新 密码 来 登录 。 


2.6.4 ”创建 用 户 
接 下 来 谈 谈 如 何 至 少 再 建立 一 个 用 户 作 普通 用 途 。 我 们 最 好 不 要 用 root 来 做 数据 库 的 日 常 
管理 。 要 建立 另 一 个 用 户 ， 用 这 条 命令 : 


mysql -U root -p -e "GRANT USAGE ON *.* 
TO "russel1L QQ@'LocaLhost 
IDENTIFIED BY 'Rover#My_1st_ Dog&Not_ Yours!';" 


上 例会 建立 名 为 russell 的 用 户 ， 并 允许 它 从 localhost 登录 MySQL。 其 中 *.* 表示 所 有 
数据 库 和 所 有 表 。 更 详细 的 解释 会 在 后 面 讲 到 。 同 时 这 里 将 其 密码 设置 为 Rover#My_1st_ 
Dog&Not_Yours!, 
他 现在 还 没有 任何 权限 : 不 能 查看 数据 库 ， 更 不 用 说 写 入 数据 。 新 建 用 户 时 ， 你 需要 考虑 
他 能 获得 什么 权限 。 如 果 你 希望 他 只 能 查看 数据 ， 那 么 用 这 条 命令 : 

mysql -U root -p -e "GRANT SELECT ON *.* TO 'russell'@' localhost';" 
这 使 得 russell 只 能 使 用 SELECT 语句 (可 查询 数据 )。 如 果 想 得 知 某 个 用 户 所 拥有 的 权限 ， 
输入 : 


mysql -u root -p -e "SHOW GRANTS FOR 'russell'@'localhost' \G" 



























































类 炎炎 淡淡 火炎 火炎 大 炎炎 淡淡 火 火 火炎 大 大 大 大火 火 火 火炎 本 row 类 淡淡 火 火 火炎 大大 炎炎 淡淡 火炎 火炎 类 类 类 炎 汪汪 火炎 火炎 


Grants for russell@localhost: 
GRANT SELECT ON *.* TO 'russell'@'localhost' 
IDENTIFIED BY PASSWORD '*B1A8D5415ACESAB4BBAC120EC1D17766B8EFF1A1' 


结果 表明 ， 该 用 户 只 能 使 用 SELECT 语句 来 查询 数据 。 我 们 会 在 后 面 更 深入 地 讲解 。 注 意 这 
里 显示 的 密码 是 加 密 后 的 。MySQL 永远 都 只 返回 加 密 后 的 密码 。 
上 例 的 russell@localhost， 无 法 增加 、 修 改 或 删除 数据 。 如 果 你 想 给 他 查询 以 外 的 权限 ， 


可 用 逗号 分 隔 来 指定 。 这 会 在 第 13 章 谈 及 。 现 在 为 了 赋予 他 所 有 权限 ， 将 SELECT 改 成 
ALL， 盈 ]; 




















mysql -U root -p -e "GRANT ALL ON *.* TO 'russell'@' localhost';" 
这 样 ，russell@localhost 就 有 了 所 有 的 基本 权限 。 你 应 建立 这 样 一 个 功能 齐全 的 用 户 ， 以 
便 在 学 习 本 书 的 过 程 中 随便 试验 。 不 过 请 另外 起 个 更 衬 你 的 名 字 。 


经 过 一 系列 的 下 载 、 安 装 、 配 置 和 授权 ，MySQL (或 MariaDB) 这 个 数据 库 系 统 已 经 能 用 
了 ， 接 下 来 你 就 可 以 学 习 如 何 操作 了 。 
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基础 知识 与 mysqt 客 户 端 





我 们 可 以 通过 各 种 不 同 的 方法 来 跟 MySQL 或 MariaDB 数据 库 交 互 。MySQL 服务 器 的 接 
口 程序 叫 作 MySQL 客户 端 。 这 类 客户 端 有 很 多 ， 但 本 书 专注 于 最 适合 交互 式 用 户 的 那 
个 一 一 文本 式 mysql。 它 是 最 常用 的 ， 高 手 都 喜欢 ， 一 般 也 推荐 新 手 使 用 。 

还 有 带 GUI 的 客户 端 ， 但 终究 没什么 用 。 首 先 ， 使 用 GUI 学 不 到 什么 东西 。 它 们 所 给 你 
的 视觉 提示 或 许 能 帮 你 完成 一 些 基 本 的 查询 ， 但 却 无 助 于 高 级 的 工作 。 而 文本 式 mysql 
则 会 驱使 你 更 多 地 思考 和 记忆 一 一 而 且 这 其 实 并 不 困难 。 更 重要 的 是 ，GUI 经 常 改变 外 
观 。 一 旦 “变脸 ”"， 你 就 要 重新 学 习 如 何 操 作 。 如 果 你 换 工作 了 ， 或 去 到 客户 现场 ,或 因 
为 各 种 理由 需要 使 用 其 他 人 的 系统 ， 你 可 能 会 发 现 新 环境 的 GUI 跟 你 惯用 的 不 同 。 然 而 ， 
mysql 客户 端 是 无 处 不 在 的 ， 因 为 它 是 与 MySQL 服务 器 一 起 安装 的 。 所 以 ， 本 书 的 示例 都 
假设 你 用 的 是 nysqL。 我 也 建议 当 你 看 到 示例 时 ， 试 着 用 mysqt 把 它们 鼓 进 计算 机 ， 以 巩 
固 学 习 。 


3.1 mysql 客 户 端 


使 用 mysql 客户 端 ， 你 便 能 在 命令 行 或 监视 器 的 环境 下 与 MySQL 或 MariaDB 交互 。 命 令 
行 方式 不 会 损耗 多 少 性 能 ， 而 且 还 能 执行 脚本 或 其 他 程序 。 例 如 ， 你 可 以 在 cron 中 写 命 
令 ， 来 执行 一 些 维护 性 工作 和 自动 备份 数据 库 。 监 视 器 则 是 一 个 ASCII 界面 ， 它 的 文字 经 
过 格式 化 ， 而 且 它 能 提供 你 所 执行 的 命令 的 详细 信息 。 本 书 绝 大 部 分 示例 都 是 从 监视 器 截 
取出 来 的 ， 剩 下 的 那些 我 会 特别 注 明 它们 来 自命 令 行 。 

如 果 MySQL 或 MariaDB 安装 正确 ， 那 么 mysql 应 该 是 可 用 的 。 如 果 不 可 用 ， 请 参考 2.6 
市 ， 确 保 一 切 都 配置 好 ， 并 建立 必要 的 软 连接 或 别名 。mysql 应 该 放 在 /bin/ 或 /usrYbin/ 目 
录 里 。 对 于 Windows、Mac 或 其 他 有 GUI 的 操作 系统 ， 可 用 文件 定位 工具 来 查找 mysql 和 
其 他 MySQL 二 进 制 文件 。 
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即使 mysql 可 用 ， 你 还 需要 一 个 MySQL 用 户 名 和 密码 才能 连接 MySQL。 如 果 你 不 是 管理 
员 ， 就 需要 找 指定 人 员 获 取 。 如 果 MySQL (或 MariaDB) 刚刚 才 安 装 好 ， 而 且 root 的 密 
码 还 没 设 置 ， 那 么 该 密码 就 是 空 的 ， 你 在 提示 输入 密码 时 直接 按 Enter 键 就 行 。 如 需 学 习 
设置 root 密码 和 创建 新 用 户 并 给 他 们 授权 ， 请 参见 2.6 节 ， 那 里 有 一 些 基本 的 技巧 ， 而 第 
13 章 则 有 更 详尽 的 细节 。 


3.2 ”连接 到 服务 器 


只 要 有 了 用 户 名 和 密码 ， 你 就 可 以 用 mysql 连接 MySQL 了 。 举 个 例子 ， 我 给 自己 创建 了 
一 个 叫 russell 的 用 户 ， 那 么 我 就 可 以 在 命令 行 上 这 样 来 连接 : 
mysql -U russell -p 


理解 这 条 命令 的 每 一 部 分 是 有 用 的 。-u 选项 后 面 是 你 的 用 户 名 。 注 意 它们 之 间 用 空格 分 
开 。 这 里 你 可 以 把 russell 替换 成 自己 创建 的 用 户 名 。 我 们 所 指 的 用 户 是 MySQL 用 户 ， 
而 不 是 操作 系统 用 户 。 顺 便 提 一 下 ， 使 用 root 连接 并 不 是 一 个 好 的 安全 实践 ， 除 非 你 要 执 
行 一 些 root 才 有 权限 执行 的 管理 任务 。 所 以 如 果 你 还 没 给 自己 建立 root 以 外 的 用 户 ， 那 么 
请 先 做 这 一 步 。 登 录 MariaDB 的 命令 也 与 MySQL 的 相同 。 

-p 选 项 会 让 mysqt 提示 你 输入 密码 。 你 可 以 在 -p 后面 加 上 密码 (如 -pRover#My_1st_ 
Dog&Not_Yours!， 其 中 -p 后 的 就 是 密码 )。 这 种 做 法 要 求 -p 和 密码 之 间 不 留 空格 。 然 而 ， 
在 命令 行 上 输入 密码 也 不 是 好 的 安全 实践 ， 因 为 这 样 密码 就 显示 在 屏幕 上 了 (站 在 你 身后 
的 人 就 能 看 到 了 ) ， 而 且 这 密码 将 在 网 络 上 以 明文 方式 传输 ， 同 时 ， 只 要 有 人 监控 着 服务 
器 的 进程 列表 ， 那 么 他 也 能 看 到 。 更 好 的 做 法 是 ，-p 选项 后 不 带 密码 ， 等 MySQL 询问 时 
才 输 入 。 那 么 密码 就 不 会 显示 在 屏幕 上 ， 也 不 会 被 保存 到 其 他 地 方 了 。 


如 果 你 要 用 的 MySQL 用 户 名 与 操作 系统 的 相同 ， 那 么 你 不 需要 加 上 -u 选项， 只 需 -p 就 
行 。 即 是 这 样 : 













































































mysqL -p 
一 旦 输入 了 正确 的 mysqt 命令 以 及 密码 ， 你 就 能 登录 到 MySQL (或 MariaDB)。 到 时 你 会 
看 到 类 似 以 下 的 内 容 : 

Welcome to the MySQL monitor. Commands end with ; or \g. 


Your MySQL connection id is 1419341 
Server version: 5.5.29 MySQL Community Server (GPL) 





Type 'help;' or '\h' for help. Type '\c' to clear the current input statement. 
mysql> 
如 果 你 装 的 是 MariaDB， 则 是 这 样 : 
Welcome to the MariaDB monitor. Commands end with ; or \g. 
Your MariaDB connection id is 360511 


Server version: 5.5.33a-MariaDB MariaDB Server, wsrep_23.7.6.rXXXX 


Copyright (c) 2000, 2013, Oracle, Monty Program Ab and others. 
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Type 'help;' or '\h' for help. Type '\c' to clear the current input statement . 
MariaDB [(none)]>> 


在 第 一 行 里 ,，“Welcome to the MySQL/MariaDB monitor” 之 后 ， 说 的 是 命令 要 以 分 号 (;) 

或 斜 线 fg (\g) 结尾 。 当 你 输入 命令 或 SQL 语句 时 ， 可 以 在 任何 地 方 按 Enter 键 来 开始 项 

的 一 行 ， 并 接着 输入 剩余 的 命令 。 在 遇 到 ; 或 \g 前 ， mysql 是 不 会 将 你 输入 的 东西 发 送 到 

MySQL 服务 器 的 。 如 果 你 用 的 是 \G (大 写 G)， 那 就 会 是 另 一 种 格式 ， 我 们 很 快 就 会 讲 

到 。 和 暂时 我 们 只 用 分 号 。 

第 二 行 告 诉 你 本 次 连接 的 标识 号 。 如 果 出 现 问题 的 话 ， 你 可 能 会 需要 用 到 它 。 但 现在 我 们 

先 忽 略 它 。 

第 三 行 告诉 你 MySQL (或 MariaDB) 的 版 本 号 。 它 能 让 你 知道 出 问题 时 你 应 找 哪个 版 本 

的 网 上 文档 。 或 者 如 果 你 在 升级 前 想 得 知 现行 版 本 ， 那 么 也 可 以 在 这 里 找到 。 

下 一 行 说 的 是 获得 在 线 帮助 。 在 线 帮助 提供 所 有 SQL 语句 和 函数 的 帮助 文档 。 你 可 试 着 输 

入 它 ， 看 能 输出 些 什么 。 

。 help 

此 命令 会 介绍 如 何 使 用 mysql。 

。 help contents 

此 命令 将 MySQL 或 MariaDB 的 各 种 帮助 分 门 别 类 地 以 列表 展示 出 来 。 在 列表 中 你 会 

到 有 个 Data Manipulation， 里 面 就 包含 了 有 关 增 删改 的 SQL 语句 。 

。 help Data Manipulation 

此 命令 会 将 所 有 可 用 的 数据 操作 语句 显示 出 来 ， 比 如 SHOW DATABASES。 

。 help SHOW DATABASES 

此 命令 用 于 找到 SQL 语句 相关 的 帮助 。 如 你 所 见 ，mysql 提供 了 大 量 有 用 的 信息 。 如 果 
你 忘 了 某 个 SQL 语法 ， 可 以 在 这 里 快速 地 找到 答案 。 

第 三 个 help 的 结果 里 ， 讲 到 了 一 个 简单 但 是 有 时 却 很 好 用 的 技巧 : 如果 你 想 取 消 输入 到 一 

半 的 SQL 语句 ， 可 接着 输入 \c， 然 后 无 需 加 分 号 ， 直 接 按 Enter 键 。 这 样 就 能 清空 mysql 

缓存 着 的 那 写 到 一 半 的 命令 ， 其 至 分 行 输入 的 也 能 清空 ， 使 你 回 到 mysql> 提示 符 。 

而 最 后 一 行 的 mysqL>， 叫 作 提 示 符 。 它 在 提示 你 输入 命令 ， 学 习 本 书 的 过 程 中 你 会 一 

与 它 打交道 。 如 果 你 没有 结束 一 条 语句 就 按 Enter 键 ， 提 示 符 就 会 变 成 ->， 告 诉 你 这 条 

SQL 还 没 发 送 给 服务 器 。 而 在 MariaDB ， 默 认 的 提示 符 则 不 是 这 样 。 它 显示 的 是 MariaDB 

[(none)]>>。 在 你 设 定 了 默认 数据 库 之 后 ， 其 中 的 none 自 会 变 成 当前 默认 数据 库 的 名 字 。 

顺便 说 一 下 ， 其 实 可 以 将 提示 符 改 成 其 他 样子 。 为 此 ， 输 入 prompt， 它 后 面 是 你 想 要 显示 

的 文字 。 另 外 你 还 可 输入 一 些 特 别 标志 〈 例 如，\d 代表 默认 数据 库 )。 下 例 可 供 参 考 : 


prompt SQL Command \d>\_ 


于 是 提示 符 就 会 变 成 : 
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SQL Command (none)> 


现在 你 还 设 有 默认 数据 库 。 既 然 你 已 经 启动 了 mysqt 客户 端 ， 那 么 我 们 就 开始 探索 数据 
库 吧 。 


3.3 ”开始 探索 数据 库 


下 面 儿童 涵盖 如 何 新 建 数 据 库 ， 并 向 其 增加 数据 ， 以 及 从 中 查询 一 些 有 趣 的 关系 。 当 你 通 
过 mysql 登录 MySQL 或 MariaDB 后 ， 就 可 从 本 章 学 习 数 据 库 系统 的 核心 概念 了 。 我 们 先 
关注 几 个 基本 概念 ， 使 你 能 在 mysql 监视 器 中 输入 一 些 命令 。 这 样 你 会 习惯 mysql 的 用 法 。 
考虑 到 你 不 一 定 是 高 手 ， 所 以 我 们 现在 会 尽量 介绍 简单 内 容 。 

先 解释 一 个 SQL 术语 一 一 表 ， 它 是 用 于 存储 数据 的 ， 反 映 用 户 查 看 数据 的 方式 。 举 个 例 
子 ， 在 关于 电影 的 表 中 ， 你 会 看 到 每 一 部 电影 都 占 一 水 平行 ， 行 中 每 列 是 电影 的 各 种 信 
息 ， 并 且 每 列 都 有 一 个 标题 。 























+---------- +--------------------- +-------- 十 
| movie id | title | rating | 
+---------- +--------------------- +-------- 十 
| 1 | Casablanca | PG | 
| 2 | The Impostors | R | 
| 3 | The Bourne Identity | PG-13 | 
+---------- +--------------------- +-------- 十 





这 只 用 于 举例 ， 我 们 不 用 你 建 这 样 的 表 。 现 在 来 看 看 服务 器 上 已 经 存在 的 东西 。 为 此 ， 我 
们 在 mysqt> 提示 符 处 输入 以 下 命令 并 按 Enter 键 : 


SHOW DATABASES,; 


接着 就 会 出 现 这 样 (或 类 似 这 样 ) 的 回应 : 








a | 

人 

| mysql | 

| test | 
首先 ， 我 们 先 讲 讲 本 书 的 约定 。MySQL 不 区 分 关键 字 (如 SHON) 的 大 小 写 ， 所 以 你 可 以 
用 show 甚至 sHoW。 然 而 ， 数 据 库 、 表 和 列 的 名 字 却 可 能 是 区 分 大 小 写 的， 尤其 是 在 那些 





大 小 写 敏感 的 操作 系统 上 ， 如 Mac OS X 或 Linux。 大 多 数 书 籍 和 文档 都 会 将 关键 字 大 写 ， 
但 同时 告诉 你 其 实 可 以 随意 大 小 写 。 对 于 数据 库 、 表 和 列 的 名 字 ， 我 们 全 用 小 写 ， 因 为 这 
样 看 着 舒服 ， 敲 字 也 简单 ， 更 重要 的 是 这 样 能 令 读 者 辨别 出 哪些 是 SQL 约定 的 ， 而 哪些 是 
可 变 的 。 

刚刚 显示 的 列表 ， 告 诉 你 现在 一 开始 就 有 了 三 个 数据 库 ， 它 们 是 安装 时 自动 创建 的 。 
information_schema 数据 库 包含 服务 器 的 相关 信息 。 接 着 是 mysql 数据 库 ， 它 则 存储 着 用 
户 名 、 密 码 和 权限 。 你 在 第 2 章 结尾 给 自己 所 创建 的 用 户 ， 甚 信息 最 终 会 放 到 这 里 。 你 也 
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许 已 注意 到 ， 第 2 章 用 到 的 一 些 命令 会 从 这 个 数据 库 获取 结果 。 但 切 勿 直接 修改 该 数据 
库 。 以 后 我 会 教 你 操作 该 库 的 命令 。 暂 时 我 们 只 以 管理 函数 和 工具 来 访问 它 。 最 后 那个 叫 
test 的 数据 库 ， 用 于 做 测试 和 练习 。 本 章 我 们 会 轻 度 使 用 它 。 


3.3.1 第 一 条 SQL 语句 
test 数据 库 一 开始 是 空 的 ， 里 面 没有 任何 表 。 那 么 我 们 就 来 建 一 个 。 不 用 担心 操作 细 市 难 
不 难 懂 ， 我 会 一 步 步 讲解 的 。 
好 了 ， 我 们 先 在 mysql 输入 以 下 命令 〈 记 得 还 有 结尾 的 分 号 ) : 

CREATE TABLE test.books (book_id INT, title TEXT, status INT); 
这 就 是 你 的 第 一 条 SQL 语句 。 它 在 test 数据 库 中 新 建 一 个 名 为 books 的 表 。 其 中 test. 
books 指定 了 数据 库 名 和 表 名 (例如 ， 格 式 是 数据 库 . 表 )。 在 括号 里 ， 我 们 还 给 这 个 表 定 
义 了 三 个 列 ， 以 后 会 进行 更 深入 的 介绍 。 
如 果 输 入 无 误 ， 你 会 得 到 这 样 的 回应 : 

Query OK, © rows affected (0.19 sec) 
服务 器 返回 的 这 个 信息 告知 你 ， 当 SQL 送出 后 ， 发 生 了 什么 。 这 里 它 的 意思 是 一 切 顺利 。 
既然 顺利 ， 我 们 就 看 看 结果 。 想 要 列 出 test 数据 库 所 有 的 表 ， 执 行 : 


SHOW TABLES FROM test; 




































































这 会 返回 
+---------------- + 
| Tables_in test | 
+---------------- + 
| books 
+---------------- 十 


1 row in set (0.01 sec) 


现在 你 有 了 一 个 表 一 一 books。 注 意 返 回信 息 用 了 一 些 ASCII 符号 来 作 间隔 ， 使 其 看 上 去 
像 个 表格 ， 你 可 以 照 着 它 在 纸 上 画 出 来 。 另 外 还 请 注意 表格 下 的 信息 。 它 说 该 集合 含有 一 
行 ， 意 味 着 books 是 test 中 唯一 的 表 。 而 服务 器 执行 每 条 SQL 语句 所 用 的 时 间 ， 都 会 显 
示 在 括号 里 。 本 例 中 我 的 服务 器 用 了 0.01 秒 。 有 具体 环境 是 ， 我 用 意大利 米兰 的 家 用 计算 
机 ， 连 到 美国 佛罗里达 州 坦 帕 市 的 服务 器 。 这 算 回 得 很 快 了 。 有 时 甚至 更 快 ， 显 示 0.00 
秒 ， 那 是 因为 时 间 实 在 太 短 ， 无 法 精确 到 那 种 程度 。 
从 现在 开始 ， 除 非 这 些 状 态 信息 值得 探讨 ， 不 然 我 会 省 略 掉 它 们 ， 以 节约 空间 并 使 我 们 只 
关注 重点 。 同 样 ， 我 会 连 mysql> 提示 符 也 省 掉 。 你 需要 分 辨 出 哪些 命令 是 从 mysql 客户 端 
输入 的 ， 哪 些 是 从 操作 系统 的 shell 输入 的 一 一 不 过 其 实 当 要 换 成 操作 系统 shell 时 ， 我 还 
是 会 提示 的 。 所 以 接 下 来 ， 输 入 跟 输 出 会 是 这 样 展示 : 


SHOW TABLES FROM test; 



























































| Tables_in test | 
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其 中 粗 体 的 是 输入 ， 非 粗 体 的 是 输出 。 


在 上 面 提 到 的 SQL 语句 中 ， 我 们 都 必须 指定 数据 库 名 。 如 果 你 基本 上 是 在 同一 个 数据 库 
中 操作 (一般人 都 是 这 样 ) ， 你 可 以 设 定 默认 数据 库 ， 这 样 就 不 用 每 次 都 输入 数据 库 名 了 。 
具体 做 法 是 用 USE 命令 


USE test 









































顺便 提 一 下 ， 如 果 你 的 服务 器 没有 test 这 个 数据 库 ， 你 可 以 先 用 CREATE 
DATABASE test; 来 建立 。 





因为 这 是 mysql 客户 端的 指令 而 非 服务 器 的 ， 所 以 我 们 通常 不 加 分 号 结尾 。 客 户 端 会 告知 
服务 器 为 它 将 默认 数据 库 改 成 指定 的 那个 。 这 样 你 就 不 必 在 指定 表 前 指定 数据 库 了 一 一 除 
非 你 想 指定 的 是 另 一 个 数据 库 。 执 行 完 USE 后 ， 你 可 以 重新 输入 刚刚 的 SQL 语句 ， 而 不 必 
肯定 test。 这 是 可 以 的 : 


SHOW TABLES; 


+--- + 
| Tables_in test | 
+---------------- + 
| books 

+---------------- + 














我 们 刚才 已 经 看 过 了 一 个 数据 库 ， 并 创建 了 一 个 表 ， 而 数据 库 其 实 就 是 由 一 堆 表 来 组 成 的 
(本 例 仅 有 一 个 表 )。 现 在 看 看 这 个 刚 建 的 表 。 我 们 要 使 用 到 SQL 语句 DESCRIBE: 


DESCRIBE books; 





+--------- +--------- +------ +----- +--------- +------- + 
| Field | Type | Null | Key | Default | Extra | 
+--------- +--------- +------ +----- +--------- +------- + 
| book id | int(11) | YES | | NULL | | 
| title | text | YES | | NULL | | 
| status | int(11) | YES | | NULL | 

+--------- +--------- +------ +----- +--------- +------- + 

















在 结果 中 ， 你 会 看 到 该 表 有 三 个 域 可 供 输入 数据 ， 它 们 分 别名 为 book_id、title 和 
status。 这 看 起 来 很 有 限 ， 那 是 因为 本 章 先 从 简单 的 讲 起 。 其 中 第 一 和 第 三 个 域 是 整数 类 
型 ,意思 是 它们 只 能 存放 数字 。 这 是 因为 我 们 在 建 表 时 使 用 了 INT 关键 字 来 规定 。 剩 下 的 
title 则 可 以 存放 文本 ， 包 含 了 你 能 从 键盘 输入 的 任何 东西 。 那 是 之 前 用 TEXT 关键 字 指定 
的 。 不 用 死记 硬 背 ， 我 们 现在 只 是 在 这 套 系统 中 到 处 先入 ， 玩 玩 mysql， 找 找 感 觉 。 
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3.3.2 插入 和 操作 数据 
让 我们 来 放 些 数据 进 这 个 表 。 用 mysql 输入 以 下 三 个 SQL 语句 : 


INSERT INTO books VALUES(100, 'Heart of Darkness', 0); 
INSERT INTO books VALUES(101, 'The Catcher of the Rye', 1); 
INSERT INTO books VALUES(102, 'My Antonia' , 0); 


这 三 条 语句 都 用 到 了 INSERT 来 向 books 表 中 插入 (或 增加 ) 数据 。 每 一 行 都 会 返回 一 个 
状态 信息 (或 者 是 错误 信息 ， 如 果 你 输 错 命令 的 话 )， 但 我 这 里 没 把 它们 贴 上 来 。 注 意 数 
字 是 不 需要 用 引号 包围 的 ， 但 文本 却 需 要 。 这 些 语句 的 语法 是 非常 结构 化 的 ， 因 此 称 为 结 
构 化 查询 语言 。 
分 号 也 不 能 缺少 ， 如 上 所 示 。 因 为 使 用 结构 化 的 语句 能 令 查 询 容 易 识 别 ， 所 以 执行 起 来 也 


更 快 。 














语句 中 各 元 素 之 间 需 要 空格 ， 数 量 随 意 ， 但 顺序 必须 妥当 ， 插 号 、 喜 号 和 












































上 例会 将 括号 里 的 值 插 入 到 表 中 。 值 的 排列 顺序 和 其 格式 ， 与 建 表 时 指定 的 一 样 ， 三 个 











域 ， 其 中 一 、 三 是 数字 ， 二 是 任何 文本 。 接 着 我 们 叫 MySQL 显示 这 些 数据 ， 看 看 会 是 什 








么 样子 : 
SELECT * FROM books; 
+--------- +------------------------ +-------- 十 
| book_id | title | status | 
+--------- +------------------------ +-------- 十 
| 100 | Heart of Darkness | 0 | 
| 101 | The Catcher of the Rye | 1 | 
| 102 | My Antonia | 0 | 
+--------- +------------------------ +-------- 十 





从 这 个 表格 中 ， 你 可 以 更 清楚 地 看 到 为 什么 它们 被 称 为 记录 行 和 域 列 。 我 们 使 用 了 SELECT 
语句 来 从 指定 的 表 中 选取 所 有 列 一 一 星 号 〈*) 就 是 代表 所 有 。 本 例 中 ， 我 们 拿 book_id 作 
为 每 条 记录 的 唯一 标识 ， 而 title 所 存 的 文本 和 status 所 存 的 数字 才 是 我 们 真正 关注 的 内 


容 。status 的 值 




















为 0 或 1 是 有 目的 的 : 0 表示 闲置 的 ，1 表示 在 用 的 。 但 其 实 设计 是 任意 


发 挥 的 ，MySQL 或 MariaDB 并 不 关心 你 的 内 容 。 顺 便 提 一 下 ， 第 二 本 书 的 标题 是 错 的 ， 
但 我 们 接 下 来 会 利用 它 来 演示 如 何 修改 数据 。 


现在 我 们 来 试验 一 下 SELECT 和 这 些 值 ， 看 看 它们 怎么 运作 。 就 加 个 WHERE 子 句 吧 ，: 


SELECT * FROM books WHERE status = 1; 





+--------- +------------------------ +-------- 十 
| book_id | title | status | 
+--------- +------------------------ +-------- 十 
| 101 | The Catcher of the Rye | 1 | 
+--------- +------------------------ +-------- 十 





从 结果 可 看 出 ， 我 们 只 选取 了 status 等 于 1 的 行 ( 即 选 出 在 用 的 记录 )。 那 就 是 WHERE 子 
名 的 效果 。 这 里 WHERE 属于 SELECT 语句 的 子 句 ， 而 不 能 单独 成 句 。 接 着 试 试 这 句 ， 要 求 返 


回 朵 置 的 : 





SELECT * FROM books WHERE status = 0 \G 


炎 兴 兴 兴 炎 兴 尖 类 火光 兴 火 类 类 炎炎 类 天 类 类 类 火炎 类 大 类 天 1. row 炎 兴 光 兴 兴 类 类 火光 光 炎炎 类 炎炎 类 天 天 类 类 大火 类 类 类 类 天 
book_id: 100 
title: Heart of Darkness 


status: 0 
类 火炎 淡 火 淡淡 火炎 淡淡 火炎 火炎 火炎 火炎 火炎 火 火 火炎 火 尖 有 row 类 淡淡 火 火炎 火 火 淡淡 火 炎炎 火炎 类 类 火 类 淡 火 炎炎 类 类 类 类 


book_id: 102 
title: My Antonia 
status: 0 


注意 这 次 我 们 将 SQL 语句 结尾 的 分 号 改 成 了 \G。 我 们 在 本 章 前 面 讲 过 ， 这 也 是 一 种 结尾 。 
它 导致 结果 不 以 表格 形式 展示 ， 而 是 使 每 条 记录 都 分 成 多 行 来 展示 。 有 时 候 这 样 更 易 读 ， 
通常 能 避免 因 域 的 内 容 太 长 ， 令 表格 变 得 太 宽 而 换行 。 不 过 这 也 只 是 偏好 问题 。 

我 们 已 经 做 到 了 给 这 个 小 小 的 表 揪 入 数据 。 现 在 请 再 来 改 一 下 数据 。 让 我 们 修改 某 一 行 的 
status。 为 此 ， 需 要 用 到 UPDATE 语句 。 它 会 产生 两 行 状态 信息 : 


UPDATE books SET status = 1 WHERE book_id = 102; 
































Query OK, 1 row affected (0.18 sec) 
Rows matched: 1 Changed: 1 Warnings: 0 


我 们 可 以 按 语 名 的 顺序 来 阅读 和 解析 它们 ， 这 样 能 更 好 地 读 懂 和 记忆 它们 的 语法 。 就 拿 上 
面 代码 块 里 的 第 一 行 语句 为 例 。 它 的 意思 是 ， 更 新 books， 将 status 的 值 设 为 1， 作用 于 
book_id 等 于 102 的 所 有 行 。 示 例 数据 中 只 有 一 行 是 102， 所 以 接 下 来 的 信息 告诉 你 ， 有 一 
行 受 影响 了 ， 并且 只 有 这 一 行 被 改变 了 ,或 者 说 被 更 新 了 一 一 你 可 能 更 喜欢 这 种 说 法 。 为 
了 看 到 结果 ， 我 们 再 运行 一 次 之 前 的 SELECT 语句 ， 即 查看 在 用 的 那 条 语句 : 


SELECT * FROM books WHERE status = 1; 














+--------- +------------------------ +-------- 十 
| book_id | title | status | 
+--------- +------------------------ +-------- 十 
| 101 | The Catcher of the Rye | 1 | 
| 102 | My Antonia | 1 | 
+--------- +------------------------ +-------- 十 


由 于 刚才 的 更 新 ， 我 们 现在 有 两 行 在 用 了 。 我 们 再 执行 一 次 UPDATE， 但 使 用 另 一 个 book_ 
tid， 将 The Catcher in the Rye 改 成 闲置 ; 


UPDATE books SET status = 0 WHERE book_id = 101; 
SELECT * FROM books WHERE status = 0; 


+--------- +------------------------ +-------- + 
| book id | title | status | 


| 100 | Heart of Darkness 
| 101 | The Catcher of the Rye 


现在 我 们 再 做 一 次 UPDATE， 让 你 看 看 怎样 通过 一 条 语句 做 更 多 的 事 。 如 前 面 说 到 的 ， 有 一 
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本 书 的 标题 错 了 。 不 应 该 是 The Catcher of the Rye， 而 应 该 是 The Catcher in the Rye。 我 们 
就 来 改 改 它 在 title 内 的 文本 ， 同 时 将 它 status 的 值 改 回 1。 该 效果 可 以 通过 两 条 语句 实 
现 ， 但 让 我 们 用 一 条 搞定 吧 : 


UPDATE books 
SET title = 'The Catcher in the Rye', status = 1 
WHERE book_id = 101; 


注意 这 里 的 语法 跟 之 前 的 UPDATE 一 样 ， 但 我 们 指定 了 要 设置 两 对 列 和 值 。 这 样 比 输入 两 条 
语句 更 简单 ， 同 时 也 节省 了 与 另 一 大 陆 的 服务 器 沟通 时 的 网 络 流 量 。 

3.3.3 ”再 复杂 一 点 

i 上 我 们 更 进一步 。 建 立 男 一 个 表 ， 并 插入 两 行 数据 。 在 mysql 中 ， 用 这 两 个 语句 : 


CREATE TABLE status_names (status_id INT, status_name CHAR(8)); 








INSERT INTO status_names VALUES(0, 'Inactive'), (1,'Active'); 


现在 我 们 有 了 status_names 表 ，, 但 它 只 有 两 列 。 此 CREATE TABLE 语句 与 我 们 第 一 次 建 表 时 
用 的 那个 很 相似 。 其 中 有 一 点 不 同 是 需要 你 注意 的 : 这 里 没有 用 TEXT 类 型 ， 而 用 了 CHAR， 
即 是 “字符 ”的 意思 。 我 们 可 以 给 这 一 列 输入 文本 ， 但 长 度 有 限 : 每 行 的 这 一 列 都 只 允许 
最 多 八 个 字符 。 这 使 得 该 域 更 小 ， 因 此 表 也 更 小 ， 处 理 起 来 也 更 快 。 不 过 这 在 我 们 的 例子 
中 没什么 作用 ， 因 为 我 们 没 打算 输入 很 多 数据 ， 但 对 于 大 型 的 数据 库 来 说 ， 这 个 细 市 却 对 
性 能 有 巨大 的 影响 。 你 最 好 在 设计 的 初始 阶段 就 考虑 好 这 种 问题 。 

第 二 个 语句 为 表 增 加 了 两 组 值 。 在 单个 INSERT 语句 中 操作 多 组 值 是 可 以 的 ， 而 且 这 样 也 比 
分 开 几 行 来 写 更 简单 。 下 面 展 示 了 该 表 数 据 的 样子 : 


SELECT * FROM status_names; 



































+----------- +------------- + 
| status_id | status_name | 
+----------- +------------- + 
| 0 | Inactive | 
| 1 | Active | 
+----------- +------------- 十 


这 些 数据 看 上 去 好 像 没 什么 用 。 但 让 我 们 来 把 它 跟 books 表 结 合 在 一 起 ， 看 看 如 MariaDB 
这 样 的 数据 库 系 统 所 隐藏 的 力量 。 我 们 将 会 用 SELECT 语句 来 连接 两 个 表 ， 以 得 出 更 好 看 的 
效果 ， 并 且 此 过 程 中 我 们 有 选择 性 地 只 让 某 些 数据 得 以 展示 。 试 试 在 你 的 计算 机 上 输入 下 
面 的 内 容 : 

SELECT book_id, title, status_name 


FROM books JOIN status_names 
WHERE status = status_id; 





























+--------- +------------------------ +------------- + 
| book id | title | status_name | 
+--------- +------------------------ +------------- + 
| 100 | Heart of Darkness | Inactive 
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| 101 | The Catcher in the Rye | Active | 
| 102 | My Antonia | Active | 
+--------- +------------------------ +------------- 十 


首先 ， 注 意 我 将 这 个 SQL 语句 拆 成 了 三 行 。 这 是 可 以 的 。 在 输入 分 号 和 按 Enter 键 之 前 ， 
没有 任何 语句 会 被 执行 。 这 样 分 行 对 人 来 说 更 加 易 读 ， 而 对 MySQL 是 没什么 影响 的 。 在 
这 个 语句 里 ， 在 第 一 行 ， 我 们 选择 了 book_id 和 title， 它 们 都 在 books 表 ， 而 status_ 
name 列 则 在 status_names 表 。 注 意 我 们 没有 使 用 星 号 来 选择 所 有 列 ， 而 是 指定 了 想 要 的 列 
名 。 另 外 ， 这 些 列 来 自 两 个 表 。 

在 第 二 行 ， 我 们 声明 了 这 些 列 取 自 books 和 status_name 表 。 其 中 JOIN 子 句 用 于 指定 第 二 
个 表 。 


在 第 三 行 的 WHERE 子 句 中 ， 我 们 告诉 MySQL， 将 books 表 的 status 列 的 值 ， 与 status_ 
names 表 的 status_id 列 的 值 匹配 起 来 。 这 使 得 两 个 表 的 行 能 连接 起 来 。 如 果 觉 得 这 个 概念 
难以 理解 ， 现 在 还 不 用 担心 。 我 只 是 为 了 演示 MySQL 和 MariaDB 的 功能 。 关 于 连接 ， 以 
后 会 做 更 详尽 的 解释 。 
在 建立 books 表 时 ， 我 们 其 实 可 以 将 status 列 声明 为 TEXT 或 CHAR， 并 为 每 条 记录 打上 
Active 或 Inactive。 但 如 果 你 要 为 books 输入 成 千 上 万 行 数据 ， 显 然 打 9 或 1 更 简单 ,而且 
不 容易 打 错 字 (例如 Actve) 。 摆 和 弄 数据 库 是 很 无 聊 的 ， 但 如 果 你 的 表 结 构建 得 好 ，SQL 语 
句 写 得 好 ， 那 么 情况 将 有 所 改善 ， 而 且 也 能 节省 你 的 时 间 和 资源 。 


3.4 小结 


对 于 我 们 刚 建 出 来 的 那些 表 ， 其 实 还 有 很 多 地 方 是 可 以 探索 的 ， 但 本 章 只 是 一 次 “闲逛 ”， 
只 需 你 对 MySQL 和 MariaDB 有 个 大 概 的 认识 。 从 第 二 部 分 的 第 4 章 (其 中 有 建 表 的 细节 
介绍 ) 开始 ， 我 们 才 会 深入 挖掘 。 

在 往 下 看 之 前 ， 你 可 能 会 想 巩 固 刚刚 学 到 的 知识 。 下 面 有 一 些 练习 ， 你 可 以 使 用 mysql 客 
户 端 连接 test 数据 库 来 做 做 。 做 完 后 ， 输 入 quit 或 exit， 再 按 Enter 键 ， 就 可 以 退出 
mysqL 了 。 


3.5 习题 


除了 用 mysql 登录 MySQL (或 MariaDB) 以 及 输入 本 章 展示 的 SQL 语句 ， 这 里 还 提供 了 
一 些 习 题 ， 让 你 继续 把 玩 mysql 以 及 助 你 更 好 地 理解 那些 基础 知识 。 你 要 使 用 一 些 更 符合 
实际 的 命名 ， 而 不 是 books 和 book_id。 为 了 贯彻 这 种 精神 ， 请 在 做 练习 时 使 用 真实 数据 
(如 人 名 要 叫 “John Smith”) 。 


(1) 用 mysql 登录 MySQL 或 MariaDB， 并 将 默认 数据 库 切 换 到 test。 建 两 个 表 ， 分 别名 
为 contacts 和 relation_types。 这 两 个 表 的 数字 列 都 用 INT 类 型 ， 字 符 列 用 CHAR 类 
型 。 为 CHAR 指定 一 个 你 想 要 的 最 大 长 度 ， 否 则 MySQL 会 使 用 CHAR 的 极限 长 度 ， 但 那 

并 不 实用 。 注 意 该 长 度 必 须 足 够 容纳 你 接 下 来 要 输入 的 数据 。 如 果 你 需要 输入 的 内 容 既 

有 数字 又 有 字符 (如 电话 号 码 中 的 连 字符 )， 那 么 使 用 CHAR。contacts 表 要 有 五 个 列 : 
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name、phone_work、phone_mobiLe、emaiL、retLation_ id。 而 relation_types 表 ， 则 只 有 
两 列 : relation_id 和 relationship。 
建 好 这 两 个 表 后 ， 用 DESCRIBE 语句 看 看 它们 的 样子 。 

(2) 输 入 数据 到 刚才 建 的 两 个 表 中 。 首 先是 relation_types 表 。 输 入 三 行 数据 。 第 一 列 填 
成 一 位 数 的 序号 形式 ， 第 二 列 填 文本 : Family、Friend、Colleague。 接 着 填 contacts 
表 ， 至 少 填 五 组 虚构 的 姓名 、 电 话 和 邮件 地 址 ， 而 在 最 后 的 relation_id 列 ， 填 入 能 与 
relation_types 的 relation_id 对 应 的 一 位 数 。 并 确认 那 三 个 relation_id 都 被 用 到 。 

(3) 执行 两 条 SELECT 语句 ， 以 获取 那 两 个 表 的 所 有 列 的 所 有 数据 。 然 后 再 写 一 条 SELECT， 
要 求 只 获取 contacts 中 的 姓名 和 邮件 地 址 。 

(4) 用 UPDATE 来 修改 刚才 输入 的 数据 。 如 果 忘 了 怎样 操作 ， 可 翻 回 本 章 前 面 看 看 。 首 先 ， 
修改 某 个 人 的 姓名 或 电话 。 接 着 ， 修 改 某 个 人 的 邮件 地 址 以 及 他 (她 ) 与 你 的 关系 ( 即 
relation_id)。 要 求 两 次 修改 都 分 别 只 用 一 条 UPDATE 语句 。 

(5) 执行 一 条 SELECT 语句 ， 连 接 习题 1 的 那 两 个 表 。 用 JOIN 子 句 来 实现 (本章 讲 到 了 JOIN 
子 句 ， 如 果 忘 了 请 回去 看 看 ) 。 因 为 两 个 表 都 有 relation_id 列 ， 所 以 就 在 这 两 列 上 连 
接 一 一 写 在 WHERE 子 句 中 。 以 下 是 提示 : 














FROM contacts JOIN relation_types 
WHERE contacts.relation id = relation types.relation id 


只 显示 你 的 Friend 的 name 和 phone_mobile 列 一 一 需要 在 WHERE 中 使 用 AND。 先 试 试 按 
relation_id 来 乌 选 ， 再 试 试 按 reLationship 往 选 。 




















第 二 部 分 


数据 库 结构 





MySQL 和 MariaDB 的 主要 部 分 就 是 数据 库 。 通 常 我 们 会 为 不 同 的 企业 、 组 织 、 部 门 或 项 
目 单独 建立 数据 库 。 至 于 如 何 区 分 不 同 ， 全 赁 个 人 喜好 。 这 样 分 别 建 库 确 实 有 利于 为 不 同 
的 用 户 (组 ) 设置 不 同 的 访问 权限 。 而 对 于 新 手 来 说 ， 先 学 好 为 一 个 组 织 建 一 个 数据 库 就 
够 了 。 


之 前 在 3.3 节 中 提 过 ， 数 据 库 可 有 多 个 表 ， 每 个 表 可 有 多 行 (或 多 条 记录 )， 每 行 可 有 多 列 
( 域 ) ， 用 于 存放 每 个 项 目的 各 方面 信息 。 与 分 别 建 库 不同 ， 分 别 建 表 是 一 种 惯用 的 策略 。 
有 些 新 手 喜欢 在 一 个 数据 库 中 建立 一 个 拥有 很 多 列 的 大 型 表 ， 但 其 实 这 样 处 理 数据 是 很 低 
效 的 。 现 实 中 ， 仅 建立 一 个 表 是 不 合理 的 。 所 以 ， 还 请 建立 多 个 小 表 ， 而 非 一 个 大 表 (这 
里 的 大 是 指 列 很 多 ) 。 


在 建 表 时 ， 我 们 需要 规划 好 方案 ， 即 需要 建 什么 域 (或 列 )。 声 明 列 时 ， 是 有 很 多 选项 的 。 
最 起 码 ， 你 要 指定 其 类 型 : 包含 字符 还 是 只 包含 整数 ?包含 日 期 和 时 间 ， 还 是 二 进 制 数 
据 ? 同时 ， 你 还 能 指定 怎样 为 该 列 建立 索引 ， 是 按 字母 序 (拉丁 文 或 是 中 文 )， 还 是 其 他 
因素 ? 

本 部 分 的 第 1 章 〈 即 第 4 章 )， 讲 述 了 如 何 建 数据 库 一 一 这 很 简单 一 一 以 及 如 何 建 表 。 另 
外 我 还 会 讲解 怎样 把 数据 放 进 表 中 ， 以 及 怎样 从 表 中 取出 数据 。 这 些 话题 会 延伸 至 后 面 很 
多 章节。 如 果 只 教 你 如 何 建 表 ， 而 不 教 如 何 用 表 ， 那 过 程 会 非常 枯燥 。 所 以 要 在 深入 到 细 
市 之 前 ， 先 告诉 你 为 什么 要 建 表 。 

刚 开始 建 表 时 ， 通 常 很 难 确定 方案 ， 对 于 新 手 来 说 尤其 是 这 样 。 所 以 我 们 总 是 会 在 建 好 后 
又 做 修改 。 因 此 ， 在 第 5 章 ， 我 们 会 看 看 如 何在 建 表 后 改 表 。 虽 然 我 可 以 将 改 表 的 章节 放 
在 数据 操作 的 章 市 之 后 再 讲 ， 但 这 样 的 话 ， 当 你 发 现 表 建 得 不 对 时 ， 就 要 在 本 书 中 跳 来 跳 
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第 4 章 


创建 数据 库 和 表 








在 插入 和 操作 数据 之 前 ， 你 得 先 建 好 一 个 数据 库 。 这 没什么 好 讲 的 ， 只 是 建立 一 个 存放 表 
的 容器 。 建 表 才 复杂 ， 你 需要 做 出 各 种 选择 。 表 有 好 几 种 类 型 ， 其 中 有 些 功 能 独特 。 在 建 
表 时 ， 你 需要 决定 其 结构 : 列 的 数量 、 每 列 的 数据 类 型 、 索 引 形式 ， 以 及 其 他 因素 。 不 
过 ， 因 为 你 还 处 于 学 习 阶 段 ， 对 于 大 多 数 的 选项 ， 你 都 可 以 采用 默认 设置 。 


以 下 是 创建 时 需要 考虑 的 一 些 基 本 问题 。 


。 数据 库 中 要 建 多 少 个 表 ， 以 及 需要 多 少 个 表 名 。 
。 每 个 表 中 要 建 多 少 列 ， 以 及 需要 多 少 个 列 名 。 
。 每 一 列 存储 的 数据 类 型 。 


对 于 最 后 那个 问题 ， 因 为 现在 只 是 刚 开始 ， 所 以 我 们 只 会 接触 四 种 类 型 数字、 少量 字符 
(不 超过 255 个 )、 大 量 文字 或 二 进 制 文件 ， 以 及 日 期 和 时 间 信 息 。 对 于 创建 数据 库 和 表 来 
说 ， 这 是 一 个 很 好 的 起 点 。 随 着 学 习 的 深入 ， 我 们 会 认识 到 更 多 的 数据 类 型 ,并 使 用 它们 
来 提高 数据 库 的 性 能 。 
本 章 含 有 建 库 和 建 表 的 示例 。 我 们 需要 你 使 用 mysql 输入 那些 SQL 语句 。 而 本 章 结 尾 的 习 
题 ， 则 要 求 你 修改 你 计算 机 上 的 数据 库 和 其 中 的 表 。 所 以 ， 当 你 看 到 示例 和 习题 时 ， 都 请 
上 机 试 试 。 

本 章 建 立 的 数据 库 和 表 ， 会 在 后 面 很 多 章节 中 用 到 ， 尤 其 是 第 三 部 分 。 到 时 候 ， 我 会 让 你 
对 这 些 表 的 数据 进行 存 取 和 修改 。 章 后 习题 也 会 使 用 本 章 这 些 表 。 因 此 ， 为 了 发 挥 本 书 的 
最 大 价值 ， 还 请 你 按部就班 地 完成 每 一 章 的 练习 。 这 将 使 你 读 得 更 深刻 ， 学 得 更 全 面 。 


4.1 创建 数据 库 


创建 一 个 数据 库 是 很 简单 的 ， 因 为 它 真 没什么 复杂 的 东西 。 你 只 要 用 到 SQL 语句 CREATE 
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DATABASE， 再 加 上 一 个 名 字 即 可 。 名 字 可 以 很 随意 ， 例 如 db1。 然 而 ， 还 是 做 得 真实 一 点 、 
有 趣 一 点 吧 。 例 如 ， 我 是 一 个 岛 类 爱好 者 ， 所 以 我 假设 我 要 做 一 个 供 观 岛 网 站 使 用 的 数据 
库 。 有 些 岛 是 群居 的 ， 有 岛 梨 的 。 于 是 ， 我 建 一 个 叫 rookery 的 数据 库 ， 以 存放 各 种 鸟 种 
信息 。 为 此 ， 先 从 mysql 客户 端 输入 以 下 命令 : 


CREATE DATABASE rookery; 






































如 之 前 所 述 ， 这 名 短小 、 初 阶 的 SQL 语句 会 在 MySQL 的 data 目录 中 建立 一 个 rookery 子 
目录 。 这 不 会 产生 任何 数据 ， 而 只 是 划 出 一 块 放 数 据 的 地 方 。 顺 便 说 一 下 ， 如 果 你 不 喜欢 
DATABASE 这 个 关键 字 ， 那 么 可 以 用 SCHEMA: CREATE SCHEMA database_name。 它 们 的 结果 是 
一 样 的 。 

虽然 我 说 很 简单 ， 但 你 也 可 以 把 它 复杂 化 。 例 如 ， 加 多 一 些 选项 ， 来 指定 默认 的 字符 集 ， 
以 及 指定 数据 的 排序 或 校对 方式 。 好 吧 ， 我 们 删 掉 rookery 数据 库 ， 再 重建 一 个 : 


DROP DATABASE rookery; 



































CREATE DATABASE rookery 
CHARACTER SET Latin1 
COLLATE Latin1_bin; 


第 一 行 的 CREATE 与 之 前 的 无 异 一 一 但 注意 ， 它 是 与 后 两 行 合 为 一 体 的 ， 因 为 到 了 第 三 行 结 
尾 才 有 分 号 出 现 。 而 第 二 行 我 们 第 一 次 见 ， 它 会 告诉 MySQL 本 库 的 表 所 默认 使 用 的 字符 
是 拉丁 文 及 其 他 字符 。 第 三 行 则 告诉 MySQL 数据 的 存储 方式 是 二 进 制 拉 丁字 符 。 关 于 二 
进 制 字符 和 二 进 制 排序 ， 我 们 会 在 后 面 章节 讲 到 ， 现 在 还 设 必 要 和 掌握。 事实 上 ， 最 简短 的 
那 种 写法 已 能 请 足 大 多 数 需求 。 后 面 所 指定 的 那 两 个 选项 ， 是 可 以 在 建 库 后 修改 的 。 我 现 
在 提出 ， 只 是 想 让 你 知道 这 东西 存在 并 可 以 由 你 自 定 义 。 

既然 我 们 建 好 了 一 个 数据 库 ， 那 么 就 去 确认 一 下 它 是 否 真 在 MySQL 服务 器 上 。 想 要 查看 
数据 库 列 表 ， 可 用 以 下 SQL 语句 : 


SHOW DATABASES ; 


















































+-------------------- 十 
| Database 
+-------------------- 十 
| information_schema | 
| rookery 

| mysql | 
| test 
+-------------------- 十 





结果 表明 ， 我 们 有 了 rookery 和 另外 三 个 安装 MySQL 时 自 建 的 数据 库 。 那 另外 三 个 ， 我 
们 在 3.3 节 中 已 经 介绍 过 了 ， 如 果 以 后 有 需要 ， 会 再 提 到 。 

在 给 rookery 建 表 前 ， 先 从 mysql 输入 以 下 命令 : 

USE rookery 


它 会 将 刚刚 建 好 的 数据 库 设 为 mysqt 的 默认 数据 库 ， 直 至 你 再 做 更 改 ， 或 退出 客户 端 。 这 
使 得 我 们 更 方便 地 用 SQL 进行 创建 表 或 其 他 与 表 相 关 的 操作 。 如 果 不 这 么 做 的 话 ， 我 们 就 












































六 


建 数 据 库 和 表 | 33 








要 在 每 条 语句 中 都 指定 数据 库 。 


4.2 创建 表 


组 建 数据 库 的 下 一 步 就 是 建 表 。 它 可 以 很 复杂 ， 也 可 以 很 简单 ， 我 们 先 从 简单 的 开始 学 
起 。 开 始 时 ， 我 们 会 建 一 个 用 表 ， 以 及 两 个 用 于 参考 的 小 表 。 主 表 会 有 很 多 列 ， 参 考 表 则 
只 有 几 个 列 。 


我 们 的 观 鸟 网 站 ， 其 关注 点 就 是 鱼 。 所 以 ， 我 们 要 建 一 个 存放 鸟 种 基本 信息 的 表 。 因 为 只 
是 一 个 习作 ， 所 以 这 个 表 我 们 不 会 做 得 很 详尽 。 在 mysql 输入 以 下 命令 : 

CREATE TABLE birds ( 

bird_id INT AUTO_INCREMENT _ PRIMARY KEY ， 

scientific_name VARCHAR(255) UNIQUE, 

Common_name VARCHAR(50), 

family_id INT, 

description TEXT); 


此 SQL 语句 会 建立 一 个 含有 五 个 域 ( 列 ) 的 表 ， 其 中 每 列 的 信息 以 逗号 分 隔 开 来 。 注 意 所 
有 列 的 定义 都 被 放 在 同一 对 括号 中 。 每 一 列 ， 我 们 都 指定 了 名 称 和 类 型 ， 某 些 列 还 带 上 了 
可 选 设 定 。 例 如 ， 对 于 第 一 列 ， 我 们 做 了 以 下 指定 。 

。 名 称 : bird_id 

。 类 型 : INT (整数 ) 

。 设 定 : AUTO_INCREMENT 和 | PRIMARY KEY 


名 称 可 以 是 SQL 保留 字 以 外 的 任何 东西 。 事 实 上 ， 用 保留 字 也 可 以 ， 但 需要 加 上 引号 以 作 
区 分 。 可 选 的 数据 类 型 ， 可 在 MySQL 和 MariaDB 的 网 站 上 找到 ， 我 的 书 《MySQL 核心 
技术 手册 》 里 也 有 介绍 。 


我 们 只 为 这 个 表 建 了 五 列 。 实 际 上 你 可 以 定 更 多 (最 多 255 列 ) ， 但 不 建议 这 么 做 。 太 多 
列 的 表 ， 用 起 来 麻烦 ， 访 问 速度 也 慢 。 最 好 还 是 拆 成 多 个 表 。 
birds 表 的 第 一 列 是 一 个 简单 的 标识 号 bird_id。 通 过 PRIMARY KEY 关键 字 ， 我 们 将 它 作为 
主键 ， 使 数据 能 以 其 索引 。 关 于 主键 的 重要 性 ， 我 们 会 在 后 面 讨论 。 

AUTO_INCREMENT 选项 则 告诉 MySQL 此 列 的 值 是 自 增 的 。 如 果 没 指定 一 个 起 始 数 ， 那 么 就 
是 从 1 开始。 


下 一 列 存放 每 种 鸟 的 学 名 (Charadrius vociferus 就 是 一 个 学 名 ， 而 Killdeer 则 不 是 )。 你 
可 能 会 觉得 我 们 不 需要 bird_id， 而 应 该 用 scientific_name 作为 索引 。 然 而 ， 学 名 可 能 
会 很 长 ， 包 含 拉丁 字母 或 希腊 字母 (说 不 定 两 种 都 有 )， 但 不 是 人 人 都 懂 这 两 种 语言 。 如 
果 要 人 输入 学 名 来 查找 记录 ， 那 就 难 搞 了 。 另 外 ， 我 们 还 将 学 名 列 设 为 变 长 字符 类 型 
(VARCHAR) 。 而 VARCHAR 后 的 括号 里 的 255 则 指定 了 最 大 长 度 (255 应 该 够 用 了 ) 。 

如 果 我 们 要 保存 的 学 名 小 于 255 个 字符 ， 存 储 引 擎 为 该 行 的 该 列 分 配 的 空间 就 会 自动 减 
少 。 它 与 CHAR 不 同 。CHAR 分 配 到 的 空间 总 是 最 大 长 度 ， 不 会 因为 内 容 少 而 减少 。 使 用 哪 
一 种 类 型 ， 是 需要 权衡 的 。 
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用 CHAR 的 话 ， 存 储 引 擎 就 能 确切 知道 该 列 会 返回 多 少 东 西 ， 这 会 令 表 运 行 得 更 快 ， 索引 也 
更 容易 维护 。 而 VARCHAR 对 硬盘 空间 的 需求 更 少 ， 利 用 效率 更 高 。 这 也 是 提高 性 能 的 一 种 
手段 。 如 果 你 能 确定 某 列 内 容 的 长 度 ， 那 就 用 CHAR， 否 则 用 VARCHAR。 

接着 ，common_name 列 被 指定 为 变 长 字符 类 型 ， 并 且 长 度 最 多 为 50 个 字符 。 


第 四 列 的 family_id 用 于 存放 鸟 科 的 标识 号 ， 以 标记 该 鸟 种 属于 哪 一 科 。 该 列 使 用 整数 类 
型 (INT)。 之 后 我 们 会 再 建 一 个 表 ， 用 于 记录 科 的 更 多 相关 信息 。 然 后 我 们 就 可 以 在 操作 
数据 时 ， 用 科 的 标识 号 对 两 个 表 进 行 连接 ， 得 知 每 种 鸟 所 属 的 科 。 

最 后 一 列 是 每 种 岛 的 描述 ， 用 TEXT 类 型 ， 即 长 度 可 变 ， 但 最 多 65 535 字 节 。 这 样 我 们 就 
能 为 每 种 鸟 输入 大 量 的 描述 ， 写 上 好 几 页 都 没 问 题 。 

当 我 们 想 在 数据 库 中 找 某 一 种 鸟 时 ， 可 能 会 想到 很 多 因素 ， 所 以 我 们 可 以 再 给 该 表 加 更 多 
的 列 : 关于 迁徙 模式 的 信息 ， 关 于 如 何在 野外 识别 它们 的 信息 ， 等 等 。 除 此 之 外 ， 数 据 类 
型 的 选择 也 有 很 多 。 我 们 可 以 指定 某 列 能 存放 极 大 的 数 ， 或 只 能 存放 不 大 的 数 ， 或 指定 它 
能 存放 二 进 制 文件 。 例 如 ， 二 进 制 类 型 使 得 我 们 可 以 为 每 种 鸟 都 存放 一 张 照片 。 现 在 建 得 
这 么 简单 ， 是 为 了 让 你 以 后 建 表 时 能 从 这 里 扩展 。 

想 看 该 表 建 成 什么 样 ， 用 DESCRIBE。 它 会 展示 一 个 表 各 列 的 信息 (或 者 说 表 结构 ) 
是 指 表 的 数据 内 容 。 为 了 查看 我 们 刚 建 的 那个 表 的 结构 ， 用 以 下 语句 : 


DESCRIBE birds; 


















































和民 


+----------------- +-------------- +------ +----- +--------- +---------------- 十 
| Field | Type | Null | Key | Default | Extra | 
+----------------- +-------------- +------ +----- +--------- +---------------- + 
| bird_id | int(11) | NO | PRI | NULL | auto_increment | 
| scientific name | varchar(255) | YES | UNI | NULL | | 
| common_name | varchar(50) | YES | | NULL | | 
| family_id | int(11) | YES | | NULL | | 
| description | text | YES | | NULL | | 
+----------------- +-------------- +------ +----- +--------- +---------------- 十 





注意 结果 展示 在 以 ASCII 字符 组 成 的 表格 之 中 。 它 看 起 来 并 不 炉 ， 但 洁净 、 快 速 ， 而 且 信 
息 完 整 。 现 在 我 们 不 看 内 容 ， 而 看 其 布局 。 


第 一 行 是 各 列 的 标题 。 第 一 列 ，Field， 用 于 展示 表 的 所 有 列 名 。 


第 二 列 ，Type， 用 于 展示 各 列 的 类 型 。 注 意 我 们 之 前 在 括号 里 定义 的 长 度 ， 在 这 里 也 有 显 
示 (如 varchar(255))。 而 INT 的 长 度 是 我 们 没有 指定 的 ， 这 里 就 显示 了 默认 值 。INT(11) 
的 意义 以 及 其 他 可 选 值 ， 会 在 以 后 介绍 。 


第 三 列 ，Null， 用 于 说 明 各 列 能 否 含有 NULL 值 。NULL 意味 着 什么 都 没有 ， 不 存在 数据 。 
它 与 空白 或 空 内 容 不 同 。 这 听 起 来 很 怪异 。 现 在 先 记 着 它们 是 不 同 的 ， 以 后 我 们 就 会 在 实 
践 中 看 到 。 
第 四 列 ，Key， 用 于 说 明 该 列 是 否 是 键 一 一 索引 列 。 如 果 此 处 为 空 ， 则 对 应 的 列 不 是 索引 
列 ， 如 common_name。 如 果 是 索引 列 ， 则 会 显示 具体 的 索引 类 型 。 因 为 空间 有 限 ， 所 以 单 
词 被 截 短 显示 。 本 例 中 bird_id 是 主键 ， 所 以 截 短 成 PRI。 而 scientific_name 则 被 设 为 另 
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一 种 索引 ，UNIQUE， 于 是 截 短 显 示 为 UNI。 


倒数 第 二 列 ，Default， 用 于 说 明 各 列 的 默认 值 。 默 认 值 可 以 是 各 种 值 的 集合 。 刚 才 建 
birds 表 时 ， 我 们 疫 有 指定 默认 值 。 默 认 值 的 设 定 可 以 在 建 表 时 做 ， 也 可 以 在 建 表 后 做 。 
最 后 一 列 ，Extra， 用 于 提供 一 些 额外 的 信息 。 在 本 例 里 ， 我 们 看 到 它 说 bird_id 是 自 增 
的 。 通 常 我 们 看 到 的 也 就 是 这 样 。 
如 果 对 现 有 的 表 结 构 不 满意 ， 可 以 使 用 ALTER TABLE 语句 (第 5 章 会 介绍 ) 来 修改 它 。 如 
果 你 做 错 了 ， 想 推倒 重 来 ， 可 以 将 整个 表 删 掉 再 重建 。 想 要 完全 删 掉 一 个 表 (包括 数据 )， 
可 以 用 DROP TABLE 语句 ， 并 指定 一 个 表 名 。 请 谨慎 使 用 该 语句 ， 因 为 它 将 导致 该 表 的 数据 
完全 丢失 ， 并 且 这 是 不 可 逆转 的 。 


顺便 提 一 下 ， 使 用 mysqt 时 ， 你 可 以 按 向 上 的 方向 键 来 获取 之 前 输入 的 每 一 
行 命令 。 所 以 说 ， 当 你 建 了 一 个 表 ， 但 DESCRIBE 发 现 错误 ， 并 将 其 删 掉 后 ， 












































你 可 以 用 向 上 键 来 找 回 建 表 的 语句 ， 然 后 用 向 左 键 ， 将 光标 移 到 错误 的 地 方 
并 做 一 些 修复 。 修 改 完 后 按 Enter 键 ， 改 过 的 CREATE TABLE 就 会 被 发 送 到 服 


4.3 ”插入 数据 


上 一 闻 有 很 多 东西 需要 你 消化 。 所 以 ， 现 在 先 吹 一下， 学 学 有 关 插 入 数据 的 问题 。 我 们 会 
用 到 INSERT 语句 ， 第 3 章 做 过 简短 的 介绍 ， 下 一 节 会 详细 介绍 。 暂 时 ， 不 要 担心 INSERT 
的 所 有 写法 。 你 只 需 用 mysql 将 以 下 语句 输入 服务 器 : 

INSERT INTO birds (scientific_name，Common_name) 

VALUES ('Charadrius vociferus', 'Killdeer'), 

('Gavia immer', 'Great Northern Loon'), 

('Aix sponsa', 'Wood Duck'), 

('Chordeiles minor', 'Common Nighthawk'), 

('Sitta carolinensis', ' White-breasted Nuthatch'), 

('Apteryx mantelli', 'North IsLand Brown Kiwi’'); 


这 会 为 六 种 鸟 建立 六 行 数据 。 接 着 用 下 面 的 语句 ， 看 看 表 的 内 容 。 


SELECT * FROM birds; 


+--------- +---------------------- +------------------- +----------- +------------- 十 
| bird id | scientific_ name | common_name | family_id | description | 
+--------- +---------------------- +------------------- +----------- +------------- 十 
| 1 | Charadrius vociferus | Killdeer | NULL | NULL 
| 2 | Gavia immer | Great Northern... | NULL | NULL 
| 3 | Aix sponsa | Wood Duck | NULL | NULL 
| 4 | Chordeiles minor | Common Nighthawk | NULL | NULL 
| 5 | Sitta carolinensis | White-breasted... | NULL | NULL 
| 6 | Apteryx mantelli | North IsLand... | NULL | NULL | 
+--------- +---------------------- +------------------- +----------- +------------- 十 





如 查询 结果 所 示 ，MySQL 按 我 们 的 要 求 在 两 列 中 填充 了 数据 ， 而 在 其 他 列 中 填 了 默认 值 
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(NULL)。 这 些 值 我 们 都 可 以 以 后 修改 。 


接着 ,在 另 一 个 数据 库 中 再 建 一 个 表 。 我 们 已 经 有 了 rookery 库 的 birds 表 来 保存 鸟 种 的 








信息 ， 那 就 再 建 一 个 观 岛 爱 好 者 的 数据 库 吧 。 这 个 数据 库 就 叫 birdwatchers， 





个 叫 humans 的 表 ， 这 样 看 起 来 就 跟 birds 对 应 了 : 


CREATE DATABASE birdwatchers; 


CREATE TABLE birdwatchers.humans 
(human_id INT AUTO_INCREMENT PRIMARY KEY, 
formal_title VARCHAR(25), 

name_first VARCHAR(25), 

name_Last VARCHAR(25), 

email_address VARCHAR(255)); 


里 面包 含 一 


这 个 表 不 算 很 详细 ， 没 有 收集 太 多 关于 会 员 的 信息 ， 先 暂时 这 样 是 够 用 的 。 接 着 就 是 输入 


数据 。 用 以 下 语句 录入 四 个 会 员 : 


INSERT INTO birdwatchers.humans 

(formal_title, name_first, name_last, email address) 

VALUES 

('Mr.', 'Russell', 'Dyer', 'russell@mysqlresources.com'), 
('Mr.', 'Richard', 'Stringer', 'richard@mysqlresources.com'), 
('Ms.', 'Rusty', 'Osborne', 'rusty@mysqlresources.com'), 
('Ms.', 'Lexi', 'Hollar', 'alexandra@mysqlresources.com'); 


这 就 输入 了 四 个 人 了 。 注 意 我 们 把 第 一 列 留 NULL， 这 样 MySQL 就 能 自动 地 为 每 行 分 配 


个 递增 标识 识 号 下 o 





我 们 已 建 好 了 一 些 简 单 的 表 ， 虽 然 可 以 搞 得 更 复杂 ， 但 这 样 就 足够 了 ， 而 且 可 以 更 好 地 理 











解 表 及 其 结构 。 


4.4 更 深入 地 理解 表 








也 





除了 使 用 DESCRIBE， 我 们 还 有 另 一 种 方法 查看 表 结构 。 你 可 以 使 用 SHOW CREATE TABLE 语 
句 。 它 基本 上 就 是 重新 展示 你 (可 能 是 在 另 一 个 数据 库 中 ) CREATE TABLE 的 命令 。 其 中 比 
较 有 趣 及 有 用 的 地 方 是 ， 它 还 告诉 你 服务 器 采用 了 什么 默认 设置 ， 如 果 你 建 表 时 有 些 选项 


























没 指定 的 话 。 以 下 是 SHOW CREATE TABLE 语句 的 使 用 方法 及 结果 : 
SHOW CREATE TABLE birds \G 


类 淡淡 火 火 火 淡淡 大 类 类 淡淡 火 火 火 火炎 大 大 类 大 大火 火 火 类 4 row 类 淡淡 火 火 火炎 大 大火 淡淡 火 火炎 火炎 类 类 类 炎 淡淡 火 火炎 类 


Table: birds 
Create Table: CREATE TABLE ‘birds. ( 
“bird id int(11) NOT NULL AUTO_INCREMENT, 
‘scientific name. varchar(255) COLLATE latin1_bin DEFAULT NULL, 
“Common_name ”varchar(50) COLLATE latini1_bin DEFAULT NULL， 
`famtLy_ id、 int(11) DEFAULT NULL， 
“descripttion ”text COLLATE Latin1_bin， 
PRIMARY KEY (`bitrd_ id)， 
UNIQUE KEY ‘scientific name. (`Sscientitfic_name `) 
) ENGINE=MyISAM DEFAULT CHARSET=Latin1 COLLATE=Latin1_bin 
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如 前 面 所 述 ， 每 一 列 都 是 可 以 指定 很 多 选项 的 。 如 果 你 不 指定 的 话 ， 服 务 器 就 会 采取 默认 
选项 。 从 这 里 你 就 可 以 看 出 这 些 默认 选项 。 注 意 我 们 没有 为 任何 一 列 指定 默认 值 (除了 第 
一 列 自 增 )， 于 是 默认 值 就 被 设 为 NULL 了 。 而 第 三 列 ， 其 字符 集 (字母 、 数 字 及 其 他 字 
符 ) 就 被 设 为 了 latin1_bin 格式 。 另 外 两 列 都 采用 了 默认 设置 。 这 来 源 于 我 们 在 本 章 开头 
建 库 时 (第 二 条 CREATE DATABASE) 的 设 定 。 我 们 可 以 将 列 的 字符 集 指定 成 与 数据 库 的 不 
同 ， 但 这 通常 没有 必要 。 

你 可 能 会 发 现 ， 结 果 中 bird_id 列 的 那些 选项 里 没有 说 明 它 是 主键 ,但 我 们 建 表 时 确实 指 
定 了 。 其 实 ， 在 这 些 列 的 说 明 的 后 面 ， 就 有 键 和 索引 的 说 明 。 这 里 显示 了 它 有 主键 索引 ， 
并 且 是 基于 bird_id 的 。 接 着 我 们 看 到 唯一 键 。 对 于 这 种 键 ， 它 的 索引 的 名 称 会 跟 该 列 一 
样 〈 括 号 中 是 列 名 )。 索 引 可 基于 多 列 来 建 ， 但 现在 我 们 只 用 一 列 。 关 于 索引 ， 我 们 会 在 
第 5 章 讲 述 。 

SHOW CREATE TABLE 的 结果 还 有 一 点 需要 我 们 注意 。 在 最 后 一 行 的 右 括号 后 ， 有 一 些 其 
他 设 定 。 首 先 ， 是 表 类 型 ， 或 者 说 是 该 表 使 用 的 存储 引擎 的 类 型 。 这 里 我 们 用 到 的 是 
MyISAM， 它 是 多 数 服 务 器 的 默认 选项 。 你 的 服务 器 所 默认 的 可 能 不 是 这 个 。 不 同 的 存储 
引擎 对 数据 的 存储 和 处 理 方式 是 不 一 样 的 。 它 们 各 有 优 缺 点 。 


剩 下 两 个 是 表 的 默认 字符 集 (Latin1) 和 默认 校对 方式 (Latin1_bin)。 这 直接 或 间接 地 来 
源 于 建 库 的 默认 值 。 你 可 以 为 一 个 表 设 定 不 同 于 库 的 字符 集 或 校对 方式 ， 甚 至 是 为 某 一 列 
设 定 。 

下 面 说 明 一 下 显 式 指定 字符 集 和 校对 方式 的 好 处 。 假 设 你 的 数据 库 服 务 于 英国 的 观 鸟 爱好 
者 群体 ， 这 样 那些 鸟 的 俗名 就 基本 上 是 用 英文 来 写 了 。 但 它 后 来 却 发 展 到 吸引 了 欧洲 其 他 
国家 的 爱好 者 ， 于 是 你 可 能 会 想 俗名 需要 容纳 其 他 语言 。 比 方 说 你 想 为 土耳其 的 网 站 建 个 
表 ， 那 么 你 就 需要 不 同 于 英文 的 字符 集 和 校对 方式 ， 因 为 土耳其 语 中 除了 拉丁 字母 ， 还 有 
其 他 字母 。 


这 时 ， 字 符 集 你 可 以 选 latin5， 它 含有 拉丁 字母 和 其 他 字母 。 而 校对 方式 ， 则 可 选 
latin5_turkish_ci， 它 会 根据 土耳其 语 的 字母 表 来 排序 。 为 了 避免 增加 列 时 忘 了 指定 字符 
集 和 校对 方式 ， 你 可 以 对 整个 表 设置 CHARSET 和 COLLATE。 


在 进行 下 一 步 之 前 ， 我 还 想 再 说 说 关于 SHOW CREATE TABLE 的 一 点 : 如 果 你 想 要 创建 一 个 
与 默认 设 定 很 不 一 样 的 表 ， 可 以 拿 SHOW CREATE TABLE 的 结果 来 作为 起 点 ， 去 构造 一 个 更 
详尽 的 CREATE TABLE 语句 。 它 还 经 常 被 人 用 来 查看 服务 器 建 表 时 到 底 在 背后 帮 有 我 们 做 了 什 
么 ， 是 基于 哪些 安装 时 设 定 。 
我 们 接着 要 建 的 表 是 bird_families。 它 用 于 存放 乌 的 科 信 息 。 它 能 与 birds 表 的 fanily_ 
id 列 进行 关联 。 这 样 我 们 就 能 避免 在 birds 表 的 每 一 行 都 录入 科 名 和 科 的 其 他 相关 信息 。 
CREATE TABLE bird_families ( 
family_id INT AUTO_INCREMENT PRIMARY KEY, 


scientific_name VARCHAR(255) UNIQUE, 
brief_description VARCHAR(255) ); 


这 个 表 建 有 三 列 。 第 一 列 是 我 们 最 关注 的 。 它 是 索引 列 ， 而 且 会 被 birds 表 参 考 。 这 昕 起 
来 好 像 是 说 它 与 birds 表 在 物理 上 有 连接 ,但 其 实 不 是 。 连 接 只 会 发 生 在 我 们 执行 SQL 语 
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句 查询 两 个 表 的 一 刻 。 在 该 SQL 语句 中 ， 我 们 会 基于 两 个 表 的 family_id 来 做 连接 。 这 
样 ， 我 们 就 能 获得 鸟 种 的 列表 ， 以 及 每 种 鸟 对 应 的 科 ， 或 者 获得 某 一 科 的 岛 种 列表 。 


现在 我 们 可 以 将 一 个 科 的 所 有 信息 放 到 一 行 中 。 而 在 为 birds 表 输 入 数据 时 ， 只 需 在 其 
bird_id 列 放置 一 个 用 于 参考 bird_families 表 的 标识 号 。 这 样 有 利于 数据 一 致 性 : 因为 填 
字母 比 填 数字 更 易 打 错字 。 而 且 ，birds_famiLies 中 一 行 的 数据 能 被 birds 中 几 百 行 数据 
所 复 用 ， 这 样 也 节省 了 空间 。 很 快 我 们 就 会 看 到 这 是 如 何 做 到 的 。 

scientific_name 列 用 于 存放 该 科 的 学 名 (如 Charadriidae)。 第 三 列 则 是 存放 俗名 (如 
Plovers)。 但 人 们 对 于 某 一 科 通 常 也 有 很 多 叫 法 ， 就 像 对 某 一 种 鸟 有 很 多 叫 法 一 样 。 所 以 
这 一 列 就 名 为 brief_description。 


接着 再 建 一 个 关于 乌 的 目 表 。 它 是 对 科 的 分 类 。 表 名 是 bird_orders。 我 们 可 以 在 其 上 面 
试 试 之 前 提 到 的 一 些 额外 选项 。 输 入 以 下 SQL 语句 : 
CREATE TABLE bird_orders ( 
order id INT AUTO_INCREMENT PRIMARY KEY ， 
scientific_name VARCHAR(255) UNIQUE ， 
brief_description VARCHAR(255), 


order_image BLOB 
) DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci; 


暂时 先 建 四 列 吧 。 第 一 列 ，order_id， 是 被 bird_families 表 参 考 的 键 。 接 着 是 scientific_ 
name， 存 放 该 目的 学 名 ， 用 VARCHAR 类 型 ， 同 时 指定 了 最 大 长 度 。 该 长 度 超出 了 我 们 的 实 
际 需 要 ， 但 因为 我 们 估计 不 了 描述 到 底 需 要 多 长 ， 而 且 该 表 应 该 不 会 有 太 多 条 目 ， 所 以 就 
用 最 大 的 吧 。 名 称 叫 作 brief_description， 跟 bird_famiLies 表 一 样 。 


因为 至 今 建立 的 表 也 都 有 着 类 似 的 列 名 (如 scientific_name)， 所 以 可 能 会 在 连接 时 导致 
一 些 问 题 。 我 们 似乎 可 以 通过 起 不 同 的 名 字 来 解决 这 个 问题 (如 order_scientific_name)， 
但 其 实 也 可 以 在 可 能 产生 冲突 时 才 处 理 。 


在 上 一 条 SQL 语句 中 ， 我 们 还 定 了 一 个 用 于 保存 该 目的 典型 照片 的 列 。 这 样 我 们 就 可 以 
将 该 目 最 具 代 表 性 的 鸟 种 或 含有 该 目的 多 个 乌 种 的 照片 放 进 去 。 注 意 该 列 的 类 型 被 定 为 
BLOB。BLOB 这 个 词 很 有 趣 ， 而 且 朗 衣 上 口 ， 其 实 它 是 二 进 制 大 对 象 的 意思 。 我 们 可 以 将 
一 张 图 像 文件 ， 如 JPEG 文件 ， 放 进 BLOB 列 。 但 这 种 做 法 通常 是 不 好 的 ， 因 为 它 会 使 得 
表 变 大 ， 导 致 备份 困难 。 更 好 的 做 法 是 将 图 像 文件 放 在 文件 系统 中 ， 然 后 将 其 文件 路 径 或 
URL 地 址 存 进 数据 库 ， 以 指示 如 何 找到 该 文件 。 不 过 我 还 是 定 了 BLOB 列 ， 以 便 让 你 知 
道 有 这 种 做 法 。 

在 定义 完 列 以 后 ， 我 们 还 加 上 了 默认 字符 集 和 校对 方式 的 定义 。 因 为 有 些 名 称 可 能 包含 有 
Latinl 以 外 的 字符 ， 所 以 这 里 我 们 使 用 了 UTF-8 (UCS Transformation Format，8-bit) 。 比 
如 说 ， 若 我 们 的 观 鸟 网 站 需要 显示 德 文 ， 那么 brief_description 列 就 需要 能 接受 德语 变 
音字 母 (如 站 ， 而 utf8 就 能 做 到 。 


对 于 一 个 真 的 观 乌 网 站 来 说 ，btrd_famittes 和 bird_orders 都 应 该 要 有 更 多 的 列 才 对 ， 而 
且 需 要 的 表 也 不 只 我 们 建 的 这 几 个。 但 作为 演示 ， 现 在 这 样 就 够 了 。 








































































































4.5 小结 


建 表 时 你 可 以 指定 更 多 选项 。 例 如 存储 引擎 就 有 多 种 选择 。 本 章 略 有 涉及 ， 但 那 只 是 冰山 
一 角 。 有 些 存储 引擎 可 以 让 你 的 数据 分 区 存放 在 服务 器 硬盘 上 的 不 同位 置 。 不 同 的 存储 引 
擎 对 性 能 有 不 同 的 影响 。 有 些 选 项 和 设 定 很 少 被 指定 ， 但 它们 确实 有 存在 的 理由 。 对 目前 
来 说 ， 这 方面 我 们 已 经 讲 得 够 多 了 。 

本 章 中 的 一 些 内 容 甚至 超出 了 这 个 阶段 的 学 习 范 畴 ， 尤 其 是 参考 表 ， 即 bird_families 和 
bird_orders。 后 面 你 将 会 深刻 体会 到 它们 的 作用 。 第 5 章 会 理 清 一 些 关 于 表 的 问题 ， 还 会 
教 你 怎样 更 改 表 。 当 中 还 穿插 着 一 些 插 入 和 选择 数据 的 示例 。 在 继续 学 习 之 前 ， 请 先 做 完 
下 一 市 的 习题 。 这 将 有 助 于 你 更 好 地 理解 表 的 原理 和 用 途 。 


4.6 ”习题 


除了 本 章 中 你 键入 MySQL 服务 器 的 那些 语句 ， 这 里 还 提供 了 一 些 让 你 巩固 建 库 建 表 技 
巧 的 练习 题 。 有 些 题目 要 求 你 建 的 表 ， 会 在 后 面 的 章 市 里 用 到 ， 所 以 ， 请 务必 完成 下 面 
的 习题 。 


(1) 使 用 DROP TABLE 语句 将 之 前 建 的 bird_orders 表 删 掉 。 找 回 其 建 表 语 句 。 复 制 或 键入 文 
本 编辑 器 ， 然 后 进行 修改 : 将 brief_description 改 成 TEXT 类 型 。 注 意 不 要 留 有 多 余 的 
逗号 。 完 成 后 ， 将 改过 的 语句 复制 到 mysql 监视 器 上 ， 并 按 Enter 键 来 执行 它 。 

如 果 报 错 ， 那 就 看 看 报错 信息 〈 可 能 不 太 明 确 )， 再 看 看 编辑 器 上 的 语句 。 检 查 一 下 改 
动 了 什么 ， 有 没有 改 错 。 确 认 关 键 字 和 值 的 位 置 正确 ， 而 且 没 有 错别字 。 改 完 后 再 试 着 
执行 ， 直 至 成 功 为 止 。 

(2) 之 前 提 过 ， 我 们 还 可 以 为 每 种 鸟 存储 更 多 相关 方面 的 信息 。 但 不 要 将 这 些 数 据 放 进 
birds 表 ， 相 反 ， 再 创建 一 个 表 ， 即 参考 表 。 用 CREATE TABLE 来 创建 ， 命 名 为 birds_ 
wing_shapes。 建 三 个 列 。 第 一 列 名 为 wing_id， 类 型 为 CHAR， 最 大 长 度 是 2。 设 该 列 为 
UNIQUE 键 ， 但 不 带 有 AUTO_INCREMENT。 我 们 将 手工 输入 两 位 代码 来 识别 每 行 的 数据 一 一 
因为 表 中 可 能 只 有 六 行 数据 ， 所 以 手工 输入 是 可 以 接受 的 。 第 二 列 叫 wing_shape， 类 
型 为 CHAR， 最 大 长 度 是 25， 用 于 描述 鸟 翼 类 型 (例如 锥 形 )。 第 三 列 是 wing_example， 
BLOB 类 型 ， 用 于 存储 该 种 鸟 强 形状 的 图 片 。 

(3) 建 完 birds_wing_shapes 表 后 ， 对 它 执行 SHOW CREATE TABLE 两 次 : 一 次 以 分 号 结尾 ， 
一 次 以 \6 结尾 。 看 看 哪 种 样式 的 结果 更 具 表 现 力 。 

将 返回 的 CREATE TABLE 语句 复制 粘贴 进 文本 编辑 器 。 然 后 用 DROP TABLE 删 掉 birds_ 
wing_shapes。 

在 编辑 器 中 改 改 复 制 来 的 语句 。 首 先是 存储 引擎 ， 如 果 ENGINE 的 值 不 是 MyISAM， 则 改 

成 MyISAM。 接 着 ， 将 字符 集 和 校对 方式 分 别 改 成 utf8 和 utf8_general_ci。 

然后 将 改过 的 语句 粘贴 到 mysql 监视 器 上 ， 并 按 Enter 键 来 执行 它 。 如 果 报 错 ， 那 就 看 

看 那 迷 惑 人 的 报错 信息 ， 再 看 看 你 编辑 器 上 的 语句 。 检 查 一 下 改动 了 什么 ， 有 没有 改 

错 。 确 认 关 键 字 和 值 的 位 置 正确 ， 而 且 没 有 错别字 。 改 完 后 再 试 着 执行 ， 直 至 成 功 。 一 

且 成 功 ， 就 用 DESCRIBE 来 查看 该 表 长 什么 样 。 
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再 建 两 个 类 似 birds_wing_shapes 的 表 。 一 个 用 于 存储 关于 鸟 的 身 形 的 信息 ， 另 一 个 用 


于 存储 关于 鸟 嘴 形 状 的 信息 。 它 们 会 有 助 于 观 岛 爱好 者 找 鸟 。 给 它们 分 别 起 名 为 btrds_ 


body_shapes、birds_biLL_shapes。 











birds_body_shapes 表 的 第 一 列 是 body_ id， 其 类 型 为 CHAR(3)， 并 且 是 UNIQUE 键 。 第 二 
列 是 body_shape， 类 型 为 CHAR(25)。 第 三 列 是 body_example， 设 为 BLOB 类 型 ， 以 便 存 








放 鸟 的 形状 图 像 。 
对 birds_bill_shapes 表 ， 也 建 三 个 类 似 的 列 : 
biLL_ id， CHAR(25) 类 型 的 bill_shape; 存放 鸟 形 

















类 型 为 CHAR(2)、 作 为 UNIQUE 键 的 
图 像 的 、BLOB 类 型 的 bill_shape。 这 





两 个 表 的 ENGINE 都 填 MyIASM， 而 DEFAULT CHARSET 填 utf8，COLLATE 则 填 utf8_ 
general_ci。 都 建 完 后 ， 用 SHOW CREATE TABLE 检查 一 下 你 的 工作 。 
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第 5 章 


更 改 表 














即使 计划 得 再 好 ， 你 偶尔 还 是 会 需要 更 改 表 的 结构 或 者 其 他 某 些 方面 的 东西 。 你 无 法 想到 
以 后 会 对 一 个 表 做 的 所 有 事情 ， 或 向 其 输入 什么 样 的 数据 。 不 过 ， 更 改 表 也 不 是 什么 难 
事 。 所 以 ， 你 无 需 在 建 表 时 追求 完美 ， 而 应 该 把 表 看 成 一 个 不 断 变化 的 事物 。 也 许 表 结构 
这 个 词 限制 了 你 的 思维 : 表 和 结构 给 人 一 种 规范 的 感觉 。 为 了 让 你 消除 这 种 感觉 ， 我 想 用 
一 句 改编 的 老话 来 “刷新 ”你 对 表 结 构 的 认识 : 它 不 是 用 石头 或 者 木头 造 的 ， 而 是 用 数码 
造 的 ， 所 以 它 能 随意 变换 。 这 话 可 能 不 会 成 为 名 言 ， 但 确实 是 有 道理 的 。 


本 章 会 探索 各 种 更 改 表 的 方法 : 如 何 增加 或 删除 列 ， 如 何 改变 列 的 数据 类 型 ， 如 何 增加 
索引 ， 以 及 如 何 改变 表 或 列 的 选项 。 另 外 ， 还 会 介绍 一 些 改 表 的 注意 事项 和 潜在 的 数据 


问题 。 


5.1 改 表 需 谨慎 


在 改 表 之 前 ， 尤 其 是 改 仿 有 数据 的 表 之 前 ， 应 该 做 好 数据 备份 。 无 论 你 的 改动 有 多 小 ， 都 
应 该 这 么 做 。 如 果 你 改 了 列 的 大 小 ， 有 可 能 会 丢失 部 分 数据 。 如 果 将 列 的 数据 类 型 改 成 与 
之 前 的 不 兼容 〈 例 如 ， 将 字符 串 数据 类 型 改 成 数值 数据 类 型 )， 有 可 能 会 丢失 全 部 数据 。 


如 果 只 改 一 个 表 ， 你 可 以 在 同一 个 数据 库 中 将 该 表 复 制 一 份 作为 备份 ， 以 便 在 出 错 后 能 把 
表 恢 复 回 原本 的 样子 。 更 好 的 做 法 是 ， 在 复制 出 的 表 上 做 改动 。 甚 至 ， 你 还 可 以 将 副本 放 
入 test 数据库， 然后 在 test 中 改 表 。 最 后 ， 用 改 好 的 表 替 换 原 本 的 表 。 关 于 这 种 做 法 ， 
本 章 后 面 会 详细 讲解 。 

不 过 ， 最 好 的 做 法 还 是 使 用 musqldump 工具 来 备份 你 要 改 的 表 ， 或 备份 整个 数据 库 。 这 
个 工具 会 在 第 14 章 介绍 。 但 为 了 让 你 更 好 地 理解 我 在 说 什么 ， 这 里 举 个 例子 : 在 命令 
行 一 一 不 是 mysql 客户 端 一 一 输入 以 下 命令 ， 即 可 使 用 mysqtdump 备份 birds 表 。( 你 需要 
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有 备份 文件 所 存放 目录 的 读 和 写 权限 ， 本 例 中 该 目录 是 /mp， 但 你 最 好 用 别 的 目 孙 ， 即 只 
有 你 能 进入 ， 而 mysqt 用 户 又 能 读 写 的 目录 。) 


mysqldump --user='russell' -p \ 
rookery birds > /tmp/birds.sql 


如 你 所 匈 ， 首 先 在 第 一 行 指定 用 户 名 (请 填 你 的 用 户 名 )， 它 需要 用 单 引 号 或 双 3 引 号 括 起 
来 ， 然 后 用 -p 来 让 mysqldump 提示 你 输入 密码 。mysqldump 还 有 很 多 其 他 选项 ， 但 对 于 我 
们 的 需求 ， 现 在 这 些 就 够 了 。 顺 便 说 一 下 ， 这 个 命令 可 以 写成 一 行 ， 也 可 以 写成 多 行 〈 就 
像 本 例 ， 用 反 斜 杠 告知 shell 下 一 行 还 有 )。 而 在 第 二 行 ， 我 们 指定 了 数据 库 名 和 表 名 。 接 
着 是 重 定向 符号 (>)， 它 告诉 shell 将 mysqldump 的 结果 送 到 /tmp 目录 的 birds.sql 文件 中 。 
上 例 只 备份 了 birds 表 。 我 们 最 好 还 是 备份 整个 rookery 数据 库 。 用 mysqldump 的 话 ， 可 
在 命令 行 输入 : 

mysqldump --user='russell' -p \ 

rookery > rookery.sql 
备份 整个 rookery 是 有 意义 的 ， 因 为 这 有 助 于 你 做 练习 时 误 删 表 后 再 恢复 。 另 外 ， 在 每 
章 结束 后 ， 都 备份 一 次 rookery， 也 是 不 错 的 做 法 。 每 次 备份 ， 都 将 备份 文件 按 章节 命名 
(如 rookery-chl-end.sql、rookery-ch2-end.sql 等 )， 这 样 你 就 能 轻松 地 回顾 本 书 的 各 个 阶段 。 


后 面 如 果 出 了 问题 ， 你 想 回 到 某 章 ， 可 以 在 命令 行 输入 : 

mysql --user='russell' -p \ 

rookery < rookery-ch2-end. sql 
注意 这 里 不 是 用 mysqtdump。 人 恢复 备份 文件 需要 用 mysqL。 当 备份 文件 (rookery-ch2-end. 
sql) 被 读 进 数据 库 时 ， 会 先 删除 rookery 的 表 和 数据 ， 再 以 备份 的 来 重 置 。 于 是 ， 没 有 备 
份 的 数据 都 将 会 丢失 。 广 意 ， 恢 复命 令 用 的 是 另 一 个 重 定向 符号 一 一 小 于 号 (<)， 来 告诉 
mysql 从 文本 文件 rookery-ch2-end.sql 中 读 取 内 容 。 我 们 可 以 指定 只 恢复 备份 文件 中 的 某 
个 表 ， 或 设 定 其 他 限制 ， 只 恢复 某 些 东西 。 有 具体 操作 会 在 第 14 章 介绍 。 下 面 就 来 学 习 在 
MySQL 和 MariaDB 中 改 表 的 必修 技能 。 


只 人 
5.2 ”必修 的 改 表 技能 
在 使 用 表 的 过 程 中 ， 无 论 是 刚 建 好 时 ， 还 是 输入 数据 后 ， 你 都 很 可 能 会 想 要 更 改 它 : 增加 
一 列 ， 改 变 列 的 数据 类 型 (例如 让 它 容纳 更 多 字符 ) ， 修 改 列 名 使 其 意义 更 明确 ， 或 者 令 
某 列 与 其 他 表 的 列 能 更 好 地 关联 。 你 可 能 会 想 增加 或 修改 索引 ， 以 加 快 数据 查找 速度 。 你 
还 可 能 想 改变 默认 值 或 选项 。 而 所 有 这 些 操 作 ， 都 可 通过 ALTER TABLE 实现 。 
ALTER TABLE 的 基本 语法 很 简单 ; 

ALTER TABLE table name changes; 

其 中 table_name 请 填 成 你 要 改 的 表 名 ，changes 则 填 成 具体 的 更 改 命令 。 各 种 可 用 的 更 改 
命令 都 会 在 本 章 依次 教授 。 
这 条 SQL 语句 本 身 很 简单 ， 麻 烦 的 是 各 种 更 改 命令 。 























































































































事实 上 ， 造 成 这 种 麻烦 的 根本 原因 
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是 ，ALTER TABLE 并 不 是 天 天 都 会 用 到 。 一 般 人 改 表 ， 就 是 从 书本 或 文档 中 查找 更 改 命 
令 ， 将 其 输入 到 服务 器 ， 然 后 忘记 自己 输 了 什么 。 相 反 ， 揪 入 数据 和 查询 数据 的 SQL 语句 
(INSERT 和 SELECT) 经 常用 ， 所 以 我 们 对 其 语法 非常 熟悉 。 所 以 ， 人 们 不 记得 如 何 用 ALTER 
TABLE 改 表 是 很 正常 的 。 


最 常 做 的 改 表 操 作 之 一 就 是 增加 列 。 其 做 法 是 ， 在 上 例 的 changes 处 ， 使 用 ADD ”COLUMN 子 
句 。 为 了 演示 ， 我 们 给 bird_families 表 增 加 一 列 ， 使 其 能 与 bird_orders 表 关 联 。 这 两 个 
表 我 们 在 第 4 章 建 过 了 。 新 加 的 列 叫 order_ id， 与 bird_orders 中 的 一 样 。 这 样 命名 是 可 
以 的 ， 而 且说 不 定 还 有 好 处 。 有 具体 来 说 ， 在 mysql 输入 以 下 命令 : 


ALTER TABLE bird families 
ADD COLUMN order_id INT; 


这 太 简 单 了 。 给 该 表 加 了 一 个 名 为 order_id 的 、 能 容纳 整数 的 列 ， 不 过 我 们 没有 让 它 像 
bird_orders 的 order_id 那样 自 增 。 我 们 不 需要 它 自 增 ， 因 为 我 们 只 会 在 bird_orders 中 
插入 新 的 order_id， 而 在 bird_families 中 参考 bird_orders。 

再 举 一 个 ADD COLUMN 的 例子 : 给 birds 表 增 加 两 列 ， 使 其 能 与 第 4 章 习 题 中 所 建 的 两 个 表 
( 即 birds_wing_shapes 和 birds_body_shapes) 关联 。 在 操作 之 前 ， 先 把 birds 复制 一 份 ， 
然后 在 副本 上 操作 。 最 后 ， 用 改 好 的 表 替 换 原 表 。 

要 复制 birds 表 ， 我 们 会 用 CREATE TABLE 语句 (第 4 章 讲 过 ) 和 LIKE 子 句 ， 并 且 将 新 表 
建 在 test 数据 库 中 以 与 原 表 区 分 开 来 (这 不 是 必要 的 ， 但 把 一 个 测试 用 的 数据 库 与 正式 的 
区 分 开 来 是 好 的 做 法 )。 你 需要 在 mysql 中 输入 如 下 命令 : 


CREATE TABLE test.birds_new LIKE birds; 
接着 输入 以 下 两 行 ， 切 换 客户 端的 默认 数据 库 ， 并 查看 新 建 的 那个 表 : 


USE test 










































































DESCRIBE birds_new; 
DESCRIBE 会 展示 新 表 的 表 结 构 。 因 为 我 们 只 复制 了 birds 的 表 结 构 ， 所 以 新 表 是 没有 数据 
的 。 为 使 其 有 数据 ， 可 用 INSERT 加 SELECT: 


INSERT INTO birds_new 

SELECT * FROM rookery.birds; 
这 是 没 问 题 的。 不 过 ， 我 们 还 有 另 一 种 方法 ， 可 以 在 建 表 时 同时 复制 表 结 构 和 数据 ; 

CREATE TABLE birds_new_aLternative 

SELECT * FROM rookery.birds; 
这 样 就 建立 了 birds_new_alternative 表 ， 并 在 其 中 填 好 了 数据 。 然 而 ， 当 你 使 用 DESCRIBE 
来 查看 该 表 时 ， 就 会 发 现 其 bird_id 列 没有 设 为 PRIMARY KEY 和 AUTO_INCREMENT。 如 果 你 
要 把 所 有 设 定 也 复制 过 来 ， 那 么 第 一 种 做 法 ， 即 CREATE. . .LIKE 然后 再 INSERT.. .SELECT 会 
比较 好 。 所 以 ， 删 掉 那 个 birds_new_alternative 吧 ， 


DROP TABLE birds_new_alternative; 





























用 DROP TABLE 语句 时 要 小 心 。 一 旦 删除 一 个 表 ， 通常 没有 方法 (至 少 没有 轻松 的 方法 ) 把 


表 找 回 ， 除 非 你 有 数据 库 的 备份 。 这 就 是 为 什么 我 在 本 章 开头 建议 你 做 好 备份 。 



































现在 让 我 们 更 改 新 表 ， 给 它 加 个 wing_id 列 ， 使 其 能 与 birds_wing_shapes 表 连 接 。 在 


mysql 中 输入 以 下 命令 : 


ALTER TABLE birds_new 
ADD COLUMN wing_id CHAR(2); 


这 会 增加 一 个 名 为 wing_id 的 列 到 该 表 上 ， 它 是 定 长 字符 类 型 ， 最 多 容纳 两 个 字符 。 我 们 
得 确保 它 的 类 型 和 大 小 都 跟 birds_wing_shapes 的 对 应 列 一 致 ， 这 样 才 能 用 这 两 列 来 连接 





两 个 表 。 
然后 ， 看 看 birds_new 的 结构 。 在 mysql 中 输入 以 下 命令 : 


DESCRIBE birds_new; 





+----------------- +-------------- +------ +----- +--------- +---------------- 
| Field | Type | Null | Key | Default | Extra 
+----------------- +-------------- +------ +----- +--------- +---------------- 
| bird_id | int(11) | NO | PRI | NULL | auto_increment 
| scientific name | varchar(100) | YES | UNI | NULL | 

| common_name | varchar(50) | YES | | NULL | 

| family_id | int(11) | YES | | NULL | 

| description | text | YES | | NULL | 

| wing_id | char(2) | YES | | NULL | 
+----------------- +-------------- +------ +----- +--------- +---------------- 




















结果 中 的 前 五 列 你 应 该 都 还 记得 吧 。 它 们 都 来 自我 们 在 第 4 章 中 建 的 btrds 表 。 





| 
| 
| 
| 
| 
| 
二 


多 出 来 的 


就 是 我 们 刚刚 加 的 。 现 在 注意 wing_id 列 ， 它 被 加 到 了 末尾 。MySQL 和 MariaDB 是 不 关 

















注 列 的 排 位 的 ， 但 是 ， 我 们 很 关注 ， 尤 其 是 面 对 那 些 拥有 大 量 列 的 表 时 。 所 以 ， 




















我 们 重新 


增加 wing_id， 并 且 这 次 要 告诉 MySQL 把 它 放 在 family_id 后 面 。 首 先 ， 删 掉 刚 加 的 这 











列 。 因 为 它 是 新 列 ， 所 以 不 用 担心 丢失 数据 。 


ALTER TABLE birds_new 
DROP COLUMN wing_id; 








这 比 增 加 列 还 要 简单 。 注 意 我 们 没有 提 及 列 的 数据 类 型 或 其 他 选项 ， 因 为 删 列 不 需要 知道 
这 些 。DROP COLUMN 会 删 掉 一 列 以 及 该 列 的 所 有 数据 。 MySQL 和 MariaDB 是 没有 UND0 命 





令 的 ， 所 以 在 生产 环境 中 操作 时 要 小 心 。 
现在 来 重新 增加 一 次 : 


ALTER TABLE birds_new 
ADD COLUMN wing_id CHAR(2) AFTER family_id; 

















这 使 wing_id 列 加 在 了 该 表 的 family_id 列 后 面 。 你 可 再 用 DESCRIBE 来 查看 结果 。 顺 便 说 














一 句 ， 若 想 将 新 列 加 在 最 前 面 ， 要 用 FIRST， 而 不 是 AFTER。FIRST 后 不 需要 带 列 





名 。 





ALTER TABLE 的 ADD COLUMN 子 句 还 可 以 用 来 一 次 增加 多 列 ， 并 指定 这 些 列 的 提 


FE 人 位。 我们 


这 就 来 试 试 增加 三 列 。 其 中 会 有 分 别 用 于 跟 第 4 章 习 题 所 建 的 birds_body_shapes 表 和 
birds_bill_shapes 表 关 联 的 列 。 另 外 我 们 还 会 多 加 一 个 域 ， 来 记录 某 一 种 鸟 是 否 是 闫 危 物 
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种 。 在 增加 列 的 同时 ， 我 们 还 想 改 变 common_name 列 的 宽度 。 现 在 它 是 50 个 字符 的 宽度 ， 
可 能 不 足以 容纳 那些 俗名 很 长 的 鸟 种 。 而 修改 列 的 大 小 ， 就 需要 用 到 CHANGE COLUMN 子 句 。 
在 mysql 中 输入 以 下 命令 : 

ALTER TABLE birds_new 

ADD COLUMN body_id CHAR(2) AFTER wing_id, 

ADD COLUMN biLL_ id CHAR(2) AFTER body_id, 


ADD COLUMN endangered BIT DEFAULT b'1' AFTER bill_id, 
CHANGE COLUMN common_name common_name VARCHAR(255); 


这 里 ADD COLUMN 的 用 法 与 之 前 的 ALTER TABLE 相似。 其 中 有 些 差异 是 需要 注意 的 。 首 先 ， 
这 次 我 们 输 了 三 个 ADD COLUMN， 两 两 之 间 以 逗号 分 隔 。 你 可 能 会 觉得 ， 一 个 ADD COLUMN 带 
着 多 个 辟 号 分 隔 的 列 声明 应 该 是 可 以 的 。 这 种 想法 很 常见 ， 其 至 有 些 老 手 也 会 这 样 以 为 ， 
但 其 实 这 是 错 的。 你 可 以 在 ALTER TABLE 中 加 入 多 个 子 句 ， 但 每 个 子 句 只 能 指定 一 列 。 这 
个 限制 看 起 来 没有 必要 ， 但 因为 改 表 影 响 重大 ， 如 果 输 错 内 容 ， 可 能 后 果 严 重 ， 所 以 为 了 
让 你 做 好 检查 ， 就 多 写 几 遍 子 句 吧 。 


在 我 们 所 加 的 endangered 列 中 ， 使 用 了 本 书 之 前 还 未 用 过 的 BIT 数据 类 型 。 这 个 类 型 只 
占 一 位 ， 状 态 有 两 种 : 1 代表 有 设 值 ，0 代表 没 设 值 。 我 们 会 用 它 来 表示 该 物种 是 否 濒危 。 
注意 这 里 我 们 用 DEFAULT 指定 了 该 列 的 默认 值 。 还 有 ， 为 了 给 位 类 型 设 值 ， 我 们 需要 将 值 
用 引号 包围 ， 并 在 前 面 加 上 字母 b。 这 种 数据 类 型 有 个 问题 。 它 确实 有 保存 值 ， 但 就 是 显 
示 不 出 值 。 如 果 有 设 值 ， 则 查询 时 不 会 显示 任何 东西 ， 导 致 ASCII 形式 的 结果 集会 在 该 位 
置 有 一 个 向 左 的 缩 进 。 这 是 MySQL 的 一 个 bug， 不 过 以 后 肯定 会 修复 的 一 一 可 能 在 你 读 
这 本 书 时 已 经 修好 了 。 这 个 bug 对 我 们 的 使 用 没什么 大 影响 。 在 导入 数据 之 后 ， 我 们 就 会 
看 看 它 实际 的 样子 。 

而 在 CHANGE COLUMN 子 句 中 ， 我 们 输入 了 common_name 两 次 。 第 一 次 用 于 指示 我 们 要 改 哪 
一 列 。 第 二 次 用 于 给 该 列 指定 一 个 新 名 字 。 不 过 即使 没 打算 改 列 名 ， 你 还 是 要 写 上 一 个 名 
字 ， 否 则 会 报错 ， 并 拒绝 执行 。 接 下 来 指定 数据 类 型 。 即 使 你 只 打算 改名 而 没 打算 改 类 
型 ， 你 还 是 要 写 上 一 个 类 型 。 基 本 上 ， 在 使 用 CHANGE COLUMN 上 时， 就算 你 只 想 修改 该 列 的 
某 一 方面 ， 服 务 器 也 需要 你 完整 地 声明 整个 新 列 。 


还 有 一 点 要 注意 的 是 ， 我 们 这 里 对 AFTER 的 使 用 与 之 前 的 不 太一 样 。 对 于 新 增 的 第 二 列 ， 
即 btLL_id， 我 们 要 求 把 它 加 在 body_id 后 面 。 你 可 能 会 认为 ， 因 为 body_id 的 声明 也 是 在 
这 同一 条 语句 之 中 ， 所 以 这 会 报错 。 然 而 ，MySQL 是 按 ALTER TABLE 的 子 句 的 编写 顺序 来 
执行 整个 操作 的 。 在 有 些 版 本 中 ， 它 会 建 一 个 临时 的 副本 表 ， 然 后 在 该 副本 上 按 子 句 的 声 
明 顺 序 ( 即 从 左 至 右 ， 而 对 于 我 们 的 例子 ， 则 是 从 上 至 下 )， 陆 续 执 行 它们 。 都 执行 完 后 ， 
如 果 没 有 错误 ， 它 就 会 用 这 个 副本 来 替换 原 表 ， 这 有 点 像 我 们 手工 的 做 法 ， 只 不 过 它 是 在 
百 台 运作 的 ， 而 且 它 更 快速 。 

如 果 处 理 ALTER TABLE 语句 的 任何 一 个 子 句 时 出 错 ， 它 就 会 册 掉 那个 副本 表 ， 而 毫 不 影响 
原 表 ， 并 返回 错误 信息 给 客户 端 。 于 是 在 上 例 中 ，MySQL 会 创建 一 个 临时 表 ， 接 着 它 首 
先 会 增加 body_id 列 ， 再 在 其 后 面 增加 btLL_id 列 。 你 可 能 试 过 在 所 有 ADD COLUMN 后 都 使 
用 AFTER wing_id。 当 然 这 不 会 报错 ， 但 是 这 些 列 的 位 置 就 与 声明 时 的 顺序 反 过 来 了 〈 即 最 
百 会 变 成 wing_id，endangered，bill_id，body_id)。 所 以 ， 如 果 要 把 body_id 放 在 wind_ 
id 后 面 ， 而 btLL_id 放 在 body_id 后 面 ， 那 么 我 们 就 要 如 这 个 例子 般 编 写 语句 。 
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下 面 来 试 试 改变 endangered 列 的 值 。 该 表 目 前 只 有 五 行 ， 而 且 疫 有 一 行 是 被 标记 为 濒危 
的 。 现 在 将 其 中 四 行 的 值 设 成 0。 我 们 会 用 到 UPDATE 语句 〈 如 果 你 觉得 它 很 陌生 ， 也 不 用 
担心 ， 这 会 在 第 8 章 详解 
































Wr 





UPDATE birds_new SET endangered = 0 
WHERE bird id IN(1,2,4,5); 


这 样 就 将 括号 中 列 出 的 bird_id 对 应 的 行 的 endangered 设置 为 0 了 ， 或 者 说 ， 将 
endangered 取消 设置 了 。 简 单 来 说 ， 就 是 只 有 bird_id 为 3 的 没 改 ， 其 他 的 都 改 了 。 回 忆 
一 下 建 endangered 时 ， 我 们 曾 为 其 指定 默认 值 b 1 ， 即 默认 设置 。 而 上 例 则 是 把 WHERE 中 
提 及 的 四 行 取消 设置 。 
现在 我 们 根据 endangered 来 用 SELECT 语句 获取 数据 (SELECT 在 第 3 章 和 第 7 章 有 介绍 )。 
因为 现在 birds_new 列 变 多 了 ， 所 以 我 们 用 \6 模式 输入 以 下 SQL 语句 ， 以 便 阅 读 。 

SELECT bird_id, scientific_name, common_name 


FROM birds_new 
WHERE endangered \G 


























类 火炎 淡 火 类 淡 火 火炎 火炎 类 火炎 火炎 火炎 淡淡 火 火 火炎 火 尖 ' row 类 淡淡 淡 火 淡淡 火炎 类 火 火炎 火炎 类 淡 火 类 炎 火炎 火炎 类 类 类 
bird_id: 3 
scientific name: Aix sponsa 
Common_name: Wood Duck 
类 火炎 淡 火 淡淡 火炎 类 火炎 类 火炎 火炎 火炎 火炎 淡 火 火炎 火炎 2 row 类 淡淡 淡 火 淡淡 火炎 类 火炎 淡淡 火 尖 类 火炎 类 火炎 火炎 类 类 类 
bird id: 6 
scientific name: Apteryx mantelli 
Common_name: North IsLand Brown Kiwi 





这 个 WHERE 子 名 的 意思 是 ， 只 选取 endangered 有 值 的 行 。 对 于 BIT 类 型 的 列 来 说 ， 
endangered 的 意思 等 同 于 endangered = 1。 如 果 想 选取 没 设置 endangered 的 行 ， 则 可 使 用 
NOT 运算 符 : 


SELECT * FROM birds_new 
WHERE NOT endangered \G 











看 过 Wood Duck 和 Kiwi 鸟 后 ， 可 能 你 希望 endangered 列 能 表示 更 多 值 ， 因 为 濒危 也 是 有 
分 各 种 级 别 的 。 我 们 可 以 (也 应 该 ) 另外 建 一 个 表 来 作为 省 危 级 别 的 参考 表 ， 但 为 了 让 你 
能 学 到 改 表 的 技能 ， 我 还 是 通过 改 列 来 做 。 与 此 同时 ， 我 还 会 演示 如 何 将 列 重 新 排 位 。 为 
了 达到 这 个 目的 ， 我们 需要 一 个 新 的 子 句 MODIFY COLUMN 


ALTER TABLE birds_new 

MODIFY COLUMN endangered 

ENUM( 'Extinct', 
'Extinct in Wild', 
'Threatened - Critically Endangered', 
'Threatened - Endangered', 
'Threatened - Vulnerable', 
'Lower Risk - Conservation Dependent ' ， 
"Lower Risk - Near Threatened ' ， 
"Lower Risk - Least Concern') 

AFTER family_id; 
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注意 MODIFY COLUMN 子 名 的 语法 只 要 求 你 输入 一 次 列 名 ， 因 为 MODIFY COLUMN 是 不 能 用 来 
改 列 名 的 。 要 改 列 名 ， 得 用 CHANGE COLUMN 子 句 。 这 里 ， 我 们 还 使 用 了 一 种 新 的 数据 类 
型 一 一 ENUM， 它 使 我 们 能 枚 举 出 可 接受 的 值 。 这 些 值 需要 放 在 一 对 括号 中 ， 每 个 值 用 引号 
包围 ， 各 值 之 间 以 逗号 分 隔 。 

接着 ， 用 SHOW COLUMN 语句 加 上 LIKE 子 句 ， 以 使 结果 仅 显 示 endangered 列 的 设 定 : 


SHOW COLUMNS FROM birds_new LIKE 'endangered' \G 
































类 淡淡 火 火 火炎 大 大 类 淡淡 火 火 火 火炎 类 尖 类 炎 汪汪 火炎 火炎 ; row 类 火炎 炎炎 淡淡 淡淡 火炎 火炎 类 炎炎 火炎 炎炎 火炎 炎炎 火炎 火 


Field: endangered 
Type: enum('Extinct','Extinct in Wild', 
"Threatened - Critically Endangered ' ， 
"Threatened - Endangered ' ， 
"Threatened - Vulnerable', 
"Lower Risk - Conservation Dependent ' ， 
'Lower Risk - Near Threatened ' ， 
'Lower Risk - Least Concern') 
Null: YES 
Key: 
Default: NULL 
ExXtras 


结果 中 除了 列举 出 各 个 值 外 ， 还 告诉 我 们 ，NULL 是 允许 的 ， 并 且 也 是 默认 值 。 我 们 可 以 
通过 NOT NULL 子 名 来 禁止 NULL 值 。 


如 果 你 想 再 增加 多 个 值 ， 可 以 再 次 使 用 ALTER TABLE 和 MODIFY COLUMN， 而 不 带 上 
AFTER 一 一 除非 你 又 想 改变 该 列 的 位 置 。 除 了 新 增加 的 值 ， 你 还 需要 再 次 枚 举 出 原本 所 有 
的 值 。 


想 要 使 用 枚 举 值 的 话 ， 你 可 以 完整 输入 该 值 ， 又 或 者 如 果 你 知道 这 些 枚 举 值 的 顺序 ， 可 以 
用 序号 来 引用 某 个 值 。 第 一 个 枚 举 值 的 序号 就 是 1。 举 个 例子 ， 你 可 以 用 如 下 命令 来 把 该 
表 的 所 有 乌 都 设 为 Lower Risk - Least Concern， 即 第 七 个 枚 举 值 : 


UPDATE birds_new 
SET endangered = 7; 


之 前 说 过 ， 如 果 可 能 的 值 不 多 ， 那 么 ENUM 类 型 可 用 于 代替 参考 表 。 然 而 ， 我 们 这 里 定 的 
endangered 的 值 不 算 短 但 又 不 够 详细 。 如 果 我 们 需要 展示 更 详细 的 信息 ， 可 以 再 建 一 个 参 
考 表 以 作 补 充 。 这 个 参考 表 会 有 与 这 些 枚 举 值 一 一 对 应 的 行 ， 并 且 每 行 还 有 其 他 列 ， 以 
显示 详尽 的 相关 信息 。 这 样 做 的 话 ，birds 表 的 枚 举 值 就 可 以 设计 得 更 简单 (例如 ，Lower 
Risk - Least Concern 改 成 LR-LC)， 而 该 值 的 具体 解释 就 放 在 另 建 的 参考 表 中 。 


不 过 ， 在 数据 操作 时 使 用 枚 举 值 的 序号 ， 直 接 把 枚 举 列 当成 参考 表 ， 这 样 似乎 更 简单 。 尽 
管 如 此 ， 我 们 还 是 应 该 再 改 改 该 列 ， 并 新 建 一 个 参考 表 。 我 们 会 在 后 面具 体操 作 。 
动态 列 


既然 讲 到 ENUM 类 型 ， 那 就 暂时 把 ALTER TABLE 放 一 边 ， 继 续 延 伸 一 下 ， 讲 讲 动态 列 ， 这 是 
MariaDB 的 v5.3 才 有 的 东西 。 它 与 ENUM 类 似 ， 但 不 是 一 扒 枚 举 值 ， 而 是 一 堆 键 值 对 。 第 
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一 次 听 说 可 能 会 觉得 很 困惑 ， 但 看 过 一 些 例子 后 你 就 会 明白 了 。 所 以 ， 先 来 建 一 些 有 动态 
列 的 表 吧 。 

为 了 使 观 鸟 爱好 者 网 站 更 吸引 人 ， 我 们 决定 对 爱好 者 们 做 一 些 调查 。 先 从 简单 的 开始 ， 我 
们 会 让 他 们 选 出 自己 最 喜欢 的 鸟 。 过 段 时 间 后 ， 我 们 可 能 还 想 让 他 们 选 出 最 佳 观 乌 地 点 ， 
或 者 最 喜爱 的 望远镜 制造 商 和 模型 。 于 是 ， 我 们 需要 建 一些 表 来 实现 这 个 需求 。 

如 果 你 用 的 不 是 MariaDB， 也 没 打算 用 MariaDB 来 替换 MySQL， 那 么 你 可 以 不 用 动手 ， 
仅仅 读书 就 行 了 。 如 果 你 安装 了 MariaDB， 那 请 输入 以 下 代码 : 


USE birdwatchers; 




















CREATE TABLE suyrveys 
(survey_id INT AUTO_INCREMENT KEY， 
survey_name VARCHAR(255)); 


CREATE TABLE suyrvey_questions 
(question_id INT AUTO_INCREMENT KEY， 
survey_id INT, 

question VARCHAR(255), 

choices BLOB); 


CREATE TABLE suyrvey_answers 
(answer_id INT AUTO_INCREMENT KEY, 
human_id INT, 

question_id INT， 

date_answered DATETIME, 

answer VARCHAR(255)); 


第 一 个 表 用 于 存放 调查 问卷 清单 。 第 二 个 表 则 用 于 存放 问卷 里 的 问题 。 因 为 我 们 只 需 受 访 
者 投票 ， 所 以 choices 列 将 会 包含 各 种 选项。 这 列 使 用 一 个 非常 通用 的 类 型 一 一 BL0B， 但 
实际 上 它 将 用 于 动态 列 。 所 选 的 数据 类 型 必须 能 容纳 动态 列 实际 的 数据 。 而 BLOB 就 是 一 个 
不 错 的 选择 。 


第 三 个 表 用 于 存放 问题 的 回答 。 这 次 我 们 的 动态 列 使 用 VARCHAR 类 型 。 最 后 survey_ 


answers 会 以 question_id 跟 survey_questions 关联 ，survey_questions 会 以 survey_id 跟 


surveys 关联 。 
接着 ， 在 这 些 表 中 输入 一 些 数据 。 如 果 你 用 的 是 MariaDB， 则 可 用 以 下 SQL 语句 : 


INSERT INTO surveys (survey_name) 
VALUES("Favorite Birding Location"); 











INSERT INTO survey_questions 

(survey_id, question, choices) 

VALUES(LAST_INSERT_ID(), 

"What's your favorite setting for bird-watching?", 
COLUMN_CREATE('1', 'forest', '2', 'shore', '3', 'backyard') ); 


INSERT INTO surveys (survey_name) 
VALUES( "Preferred Birds"); 


INSERT INTO survey_questions 
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(survey_id, question, choices) 

VALUES( LAST_INSERT_ID(), 

"Which type of birds do you like best?", 

COLUMN_CREATE('1', 'perching', '2', 'shore'’, '3', 'fowl', '4', 'rapture') ); 


于 是 我 们 有 了 两 个 问卷 : 一 个 问 人 们 喜欢 到 哪里 观 鸟 ， 另 一 个 则 问 人 们 喜欢 哪 种 鱼 。 这 里 


我 人 

















] 只 提供 一 些 很 简单 的 、 不 全 面 的 选项 。COLUMN_CREATE() 用 于 创建 选项 的 枚 举 : 每 个 选 

















项 都 有 一 个 键 和 一 个 值 。 例 如 ， 选 项 1 是 forest， 选 项 2 是 shore， 选 项 3 是 backyard。 而 
从 MariaDB v10.0.1 开始 ， 键 还 可 以 用 字符 ， 而 不 只 是 数字 。 








下 


看 来 看 看 如 何 从 动态 列 获取 数据 : 








2 


SELECT COLUMN_GET(choices, 3 AS CHAR) 
AS 'Location' 

FROM survey_questions 

WHERE survey_id = 1; 

















ee 会 返回 第 三 个 选项 。 我 们 使 用 了 COLUMN_GET()， 其 中 第 一 个 参数 填 动 态 列 的 列 
二 个 参数 填 该 动态 列 的 键 ， 这 样 就 能 获取 其 对 应 的 值 了 。 同 时 ， 我 们 还 包含 了 一 个 














人 来 将 返回 的 数据 转换 成 我 们 指定 的 类 型 ( 即 GuAR)。 


接着 ， 录 入 会 员 的 答案 。 如 果 你 在 看 的 是 这 本 书 的 电子 版 ， 那 么 把 下 面 的 语句 复制 粘贴 到 
MariaD 服务 器 就 好 了 : 


这 




















INSERT INTO survey_answers 

(human_id, question id, date_answered, answer) 
VALUES 

(29, 1, NOW(), 2), 

(29, 2, NOW(), 2), 
(35, 1, NOW(), 1), 
(35, 2, NOW(), 1), 
(26, 1, NOW(), 2), 
(26, 2, NOW(), 1), 
(27, 1, NOW(), 2), 
(27, 2, NOW(), 4), 
(16, 1, NOW(), 3), 
(3, 1, NOW(), 1), 
(3, 2, NOW(), 1); 


里 没有 多 少 行 ， 但 暂时 来 说 已 经 足够 了 。 现 在 就 来 给 第 一 个 问卷 点 票 : 





SELECT IFNULL(COLUMN_GET(choices, answer AS CHAR), 'total') 
AS 'Birding Site', COUNT(*) AS 'Votes' 

FROM survey_answers 

JOIN survey_questions USING(question_id) 

WHERE survey_id = 

AND question_id = 

GROUP BY answer WITH ROLLUP; 





+-------------- +------- + 
| Birding Site | Votes | 


+--- +------- + 
| forest | 2 | 
| shore | 3:0| 
| backyard | 41 
| total | 6 | 
+---- +------- 十 


在 WHERE 子 句 中 ， 我 们 指定 了 survey_id 和 question_id 来 选取 我 们 想 看 的 问卷 和 问题 。 然 
后 我 们 取出 该 问题 的 所 有 答案 ， 把 它们 聚集 起 来 ， 计 算出 每 个 答案 被 投了 多 少 票 。 

不 过 这 里 没 多 少数 据 。 我 会 添加 更 多 答案 ， 以 造 出 一 个 更 大 的 表 来 再 做 统计 。 你 可 以 到 我 
的 网 站 (http://mysqlresources.com/files) 下 载 这 个 表 。 本 书后 面 的 示例 会 用 到 它 。 动 态 列 
是 一 个 新 特性 ， 它 仍 在 不 断 开发 中 ， 所 以 暂时 来 说 ， 简 单 介 绍 已 足够 。 下 面 我 们 回 到 更 正 
式 的 改 表 话 题 。 


5.3 选修 的 改 表 技能 


ALTER TABLE 最 常用 于 增加 和 重 命名 列 ， 但 除 此 之 外 ， 它 还 可 以 用 于 设置 表 和 列 的 某 些 选 
项 。 你 还 可 以 用 它 来 设置 表 变 量 ， 以 及 列 的 默认 值 。 本 节 会 介绍 如 何 修改 这 些 设 定 和 值 ， 
以 及 如 何 重 命名 一 个 表 。 另 外 ， 索 引 也 是 可 以 更 改 的 。 这 个 话题 会 在 5.4 节 展 开 。 


5.3.1 设置 列 的 默认 值 


你 可 能 注意 到 了 ， 之 前 那些 DESCRIBE 语句 的 结果 示例 里 都 有 Default 列 。 你 可 能 还 注意 到 
了 ， 几 乎 所 有 域 的 默认 值 都 是 NULL。 这 意味 着 ， 如 果 用 户 不 给 该 列 输入 一 个 值 ， 那 么 该 
列 的 值 将 是 NULL。 如 果 你 想 为 某 列 指定 默认 值 ， 那 么 可 以 在 建 表 时 声明 。 而 对 于 已 建 好 
的 表 ， 可 以 使 用 ALTER TABLE 语句 来 指定 一 个 有 别 于 NULL 的 默认 值 。 这 并 不 会 改变 现 有 
行 的 值 一 一 包括 那些 以 前 套用 了 默认 值 的 行 。 改 默认 值 可 用 CHANGE 子 句 或 ALTER 子 句 。 我 
们 先 来 看 看 一 个 使 用 CHANGE 子 句 的 示例 。 


假设 在 我 们 的 数据 库 中 ， 大 部 分 鸟 的 endangered 列 的 值 都 是 Lower Risk - Least Concern。 
那么 我 们 可 以 直接 更 改 该 列 的 默认 值 ， 这 样 就 不 用 每 次 都 在 INSERT 语句 (用 于 插入 数据 ) 
中 输入 Lower Risk - Least Concern 或 其 对 应 的 枚 举 序号 了 。 所 以 我 们 接 下 来 就 来 操作 ， 
并 且 ， 为 了 适 配 将 建立 的 用 于 存放 鸟 种 保护 状态 的 参考 表 ， 我 们 还 要 把 endangered 列 从 
ENUM 类 型 改 成 INT。 另 外 ， 为 了 更 加 好 玩 ， 我 们 会 在 建 表 后 ， 将 之 前 输 过 的 endangered 值 
插入 进去 。 下 面 我 们 就 开始 了 ， 先 在 mysql 中 输入 以 下 命令 ， 创 建 参考 表 。 

CREATE TABLE rookery.conservation_status 

(status_ id INT AUTO_INCREMENT PRIMARY KEY ， 


conservation_category CHAR(10), 
conservation_state CHAR(25) ); 


参考 表 被 命名 为 conservation_status， 这 比 endangered 听 起 来 更 明了 。 注 意 我 们 将 每 种 
状态 都 分 成 两 列 。 例 如 Lower Risk - Least Concern， 它 其 实 指 的 是 Lower Risk 类 中 的 
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Least Concern 状态 。 所 以 我 们 需要 有 了 两 列 ，Lower Risk 放 在 conservation_category， 而 


Least Concern 放 在 conservation_state。 


接着 ， 将 所 有 的 数据 都 插入 该 表 中 。 这 会 用 到 INSERT 语句 (第 3 章 简单 介绍 过 ) : 


INSERT INTO rookery.conservation_status 
(conservation_category, conservation_state) 
VALUES( 'Extinct','Extinct'), 
('Extinct','Extinct in Wild'), 
('Threatened','Critically Endangered'), 
('Threatened','Endangered'), 
('Threatened','Vulnerable'), 

('Lower Risk','Conservation Dependent ' ) ， 
('Lower Risk','Near Threatened ' ) ， 

('Lower Risk','Least Concern ' ) ; 


如 果 你 看 不 太 懂 上 面 的 语句 ， 先 别管 它 ， 输 进去 就 好 了 ， 我 们 会 在 第 6 章 深 入 讲解 。 然 
后 ， 我 们 来 看 看 这 个 表 有 了 数据 以 后 是 什么 样子 。 输 入 以 下 SQL 语句 ( 粗 体 部 分 )， 不 要 
把 结果 也 输入 进去 。 


SELECT * FROM rookery.conservation_status; 



































+----------- +----------------------- +------------------------ 十 
| status_id | conservation category | conservation_state | 
+----------- +----------------------- +------------------------ + 
| 1 | Extinct | Extinct | 
| 2 | Extinct | Extinct in Wild | 
| 3 | Threatened | Critically Endangered | 
| 4 | Threatened | Endangered | 
| 5 | Threatened | Vulnerable | 
| 6 | Lower Risk | Conservation Dependent | 
| 7 | Lower Risk | Near Threatened | 
| 8 | Lower Risk | Least Concern | 
+----------- +----------------------- +------------------------ 十 








一 列 取 自 AUTO_INCREMENT， 这 是 我 们 在 建 表 时 指定 的 ， 而 其 他 列 ， 是 我 们 INSERT 时 指 
定 的 。 


注意 我 们 在 表 名 前 还 加 了 数据 库 名 ( 即 rookery.conservation_status)。 这 是 因为 我 们 
用 USE 把 默认 数据 库 设 为 了 test。 接 着 回 到 birds_new 表 ， 我 们 已 经 准备 好 改 endangered 
列 了 。 之 前 已 决定 好 ， 我 们 需要 将 该 列 的 默认 值 设 为 Lower Risk - Least Concern, 或 
conservation_status 表 中 相应 的 列 组 合 所 确定 的 status_id。 看 看 conservation_status 
的 查询 结果 ， 你 会 发 现 我 们 所 需 的 status_id 是 8。 现 在 ， 就 用 以 下 语句 来 修改 列 名 和 上 默 
认 值 : 


ALTER TABLE birds_new 
CHANGE COLUMN endangered conservation_status_id INT DEFAULT 8; 


个 语法 基本 上 与 本 章 之 前 使 用 CHANGE 子 句 的 例子 一 致 ( 即 是 那个 输入 两 次 列 名 然后 再 
改 雪 据 关 型 的 例 于 ， 不 过 那 次 你 没 想 要 改 列 名 )。 不 同 的 是 ， 这 次 我 们 还 增加 了 关键 字 
DEFAULT， 并 在 其 后 带 上 我 们 要 设置 的 默认 值 一 一 如 果 该 值 是 字符 串 ， 则 需要 用 引号 包围 。 
本 例 也 改 了 列 名 。 但 如 果 你 只 想 设 置 默认 值 ， 可 以 使 用 ALTER 子 句 。 我 们 就 试 试用 它 来 设 

































































TI 
































置 默认 值 为 7: 


ALTER TABLE birds_new 
ALTER conservation_status_id SET DEFAULT 7; 


这 更 简单 了 。 它 只 设置 了 默认 值 。 注 意 第 二 行 开头 用 的 是 ALTER 而 非 CHANGE。 其 后 接 列 
名 ， 然 后 是 属于 ALTER 的 SET 子 句 。 现 在 用 SHOW COLUMNS， 单 单 显 示 该 列 : 


SHOWN COLUMNS FROM birds_new LIKE 'conservatiLon_status_iLd' \G 

















类 淡淡 淡淡 火炎 类 大 类 类 炎炎 火 火 火炎 类 大 大 类 大 大火 火 火 类 二 < row 类 淡淡 火 火 火炎 炎炎 炎炎 淡淡 火 火炎 炎炎 汪 炎 火炎 火炎 火炎 类 


Field: conservation_status_id 
Type: int(11) 
Null: YES 
Key: 
Default: 7 
Extra: 


如 你 所 见 ， 现 在 默认 值 是 7。 如 采 我 们 又 改变 主意 ， 想 将 其 设 回 NULL 或 该 列 数据 类 型 的 
默认 值 ， 那 么 可 以 用 以 下 命令 : 


ALTER TABLE birds_new 
ALTER conservation_status_id DROP DEFAULT; 


关键 字 DROP 的 这 种 特殊 用 法 不 会 删除 列 的 数据 ， 只 会 更 改 列 的 默认 值 设 定 。 请 在 你 的 机 器 
上 用 sHow COLUMNS 看 看 默认 值 重 置 的 样子 。 然 后 ， 将 它 改 回 7。 




















5.3.2 ”设置 AUTO_INCREMENT 的 值 


数据 库 中 很 多 主 表 的 主键 都 会 用 到 AUTO_INCREMENT 选项 。 它 会 在 information_schema 库 
的 tables 表 中 创建 一 个 AUTO_INCREMENT 变量 。 你 应 该 记得 这 个 数据 库 名 。 我 们 在 3.3 节 中 
使 用 SHOW DATABASE 语句 时 看 到 过 它 。 每 次 你 建 表 时 ，MySQL 都 会 在 information_schema 
库 的 tables 表 中 加 入 一 行 。 而 tables 表 中 就 有 一 列 叫 作 auto_increment。 新 增 行 时 所 需 
的 自 增 值 就 从 那里 获取 。 除 非 你 在 建 表 时 另外 指定 初始 值 ， 不 然 它 初始 就 是 1。 现在 用 
SELECT 来 看 看 该 列 的 值 : 

SELECT auto_tLncrement 


FROM information_schema.tables 
WHERE table_name = 'birds'; 








wr 





+--- + 
| auto_increment | 
+---------------- + 
| 7 | 
+--- + 


因为 我 们 没有 在 建 birds 表 时 设置 AUTO_INCREMENT 的 值 ， 而 该 表 又 只 输入 过 六 种 鸟 的 数 
据 ， 所 以 它 的 初始 值 是 1， 现 在 增长 到 了 7。 这 意味 着 你 为 birds 表 插 入 下 一 行 时 ， 可 从 这 
里 获取 7 作为 bird_id。 


如 果 你 想 改 变 某 个 表 的 AUTO_INCREMENT 的 值 ， 可 以 使 用 ALTER TABLE。 为 了 演示 ， 现 在 试 
试 将 birds 表 的 AUTO_INCREMENT 的 值 设 为 10。 先 切换 回 rookery 库 。 在 mysql 中 输入 以 下 





























更 改 表 | 53 


USE rookery 
ALTER TABLE birds 
AUTO_INCREMENT = 10; 


这 样 ，birds 表 的 下 一 行 的 bird_id 就 能 从 10 开始 了 。 更 改 自 增值 并 不 常见 ， 但 你 需要 知 
道 ALTER TABLE 还 有 这 种 用 法 ， 毕 竞 增长 一 下 见识 是 不 错 的 。 


5.3.3” 改 表 和 建 表 的 另 一 种 方法 

有 些 时 候 你 可 能 会 觉得 某 些 表 建 了 大 多 列 。 或 许 有 些 列 拿 出 来 放 在 一 个 独立 的 表 中 会 更 
好 。 又 或 者 你 在 一 个 现 有 的 表 中 加 了 一 些 列 ， 但 过 段 时 间 发 现 它 的 结构 不 太 对 。 无 论 哪 种 
情况 ， 你 都 可 以 建 一 个 小 表 ， 然 后 将 大 表 的 数据 移 过 去 。 一 种 做 法 是 ， 建 一 个 表 ， 其 列 的 
设置 如 同 原 大 表 中 所 需 移动 的 列 ， 然 后 从 大 表 复 制 数 据 到 小 表 ， 最 后 删 掉 大 表 中 不 再 需要 
的 列 。 如 果 你 用 这 种 做 法 来 转移 数据 ， 那 么 必须 保证 新 表 的 列 的 设 定 与 原 表 一 致 ， 以 避免 
数据 丢失 或 其 他 问题 。 


更 简单 的 做 法 是 使 用 CREATE TABLE 语句 加 LIKE 子 句 ， 来 根据 原 表 创建 出 新 表 。 现 在 试 试 
建 一 个 birds 表 的 副本 。 在 mysqt 中 输入 以 下 命令 : 
CREATE TABLE birds_new LIKE birds; 


这 就 建 了 另外 一 个 如 同 birds 的 表 ， 它 名 为 birds_new。 用 SHOW TABLES 就 能 看 到 这 两 
个 表 。 









































表 名 含有 下 划 线 〈 即 _) 是 可 以 的 ， 而 连 字符 则 最 好 不 要 。MySQL 会 将 连 字 
符 解析 为 减 号 ， 并 用 其 两 端的 文字 做 运算 ， 这 会 产生 错误 。 如 果 你 真 的 要 在 
表 名 中 用 连 字符 ， 则 无 论 何 时 都 要 用 引号 包围 该 表 名 。 





























用 以 下 语句 看 看 你 有 什么 表 和 数据 : 
DESCRIBE birds; 
DESCRIBE birds_new; 


SELECT * FROM birds_new; 
Empty set (0.00 sec) 


前 两 句 用 于 显示 这 两 个 表 的 结构 。 你 会 发 现 它们 除了 表 名 ， 其 他 完全 一 样 。 为 了 节省 空 
间 ， 我 就 不 把 结果 贴 上 来 了 。 

第 三 句 用 于 显示 birds_new 表 的 所 有 数据 。 但 因为 我 们 在 建新 表 时 只 从 birds 表 复 制 了 表 
结构 ， 所 以 是 没有 数据 的 一 一 它 也 返回 了 “ 空 ”的 提示 。 如 果 想 要 有 数据 的 话 ， 可 以 在 改 
完 表 后 再 复制 数据 。 

此 方法 也 可 用 于 想 要 对 表 进 行 大 改 的 情况 。 如 果 是 大 改 的 话 ， 在 表 的 副本 上 操作 是 不 错 的 
做 法 。 用 ALTER TABLE 修改 复制 出 来 的 表 (如 birds_new) ， 改 完 后 ， 从 旧 表 复制 数据 到 新 
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表 ， 最 后 删 掉 旧 表 ， 给 新 表 改 名 。 


不 过 ， 还 有 一 个 小 问题 。 之 前 说 过 ， 它 们 除了 表 名 ， 其 他 方面 都 一 样 ， 但 这 并 不 完全 正 
确 。 还 可 能 有 一 点 不 同 的 是 ， 如 果 新 表 有 一 列 使 用 AUTO_INCREMENT 作为 默认 值 ， 那 么 它 
自 增值 将 是 从 0 开始 。 你 需要 根据 birds 表 AUTO_INCREMENT 的 当前 值 来 设 定 新 表 AUTO_ 
INCREMENT 的 初始 值 ， 以 使 新 表 的 新 行 能 获取 正确 的 标识 号 。 在 mysql 输入 以 下 语句 : 


SHOW CREATE TABLE birds \G 


结果 (这 里 没 贴 出 来 ) 中 的 最 后 一 行 会 显示 AUTO_INCREMENT 的 当前 值 。 例 如 这 样 : 







































































) ENGINE=MyISAM AUTO_INCREMENT=6 DEFAULT CHARSET=Latin1 COLLATE=Latin1_bin 


在 此 摘录 中 ， 可 以 看 到 AUTO_INCREMENT 的 当前 值 是 6。 现 在 ， 用 以 下 语句 来 将 birds_new 
的 值 也 改 成 跟 它 一 样 : 
ALTER TABLE birds_new 
AUTO_INCREMENT = 6; 


当 你 准备 好 复制 数据 时 ， 就 可 以 用 INSERT.. .SELECT 语法 了 。 这 会 在 6.3 节 中 介绍 。 


除了 在 改 好 新 表 后 再 复制 数据 ， 你 还 可 以 在 创建 新 表 的 同时 进行 复制 。 如 果 你 想 将 某 些 列 
连带 数据 一 起 复制 ， 并 且 不 打算 修改 这 些 列 ， 那 么 这 种 做 法 很 适合 你 。 要 达到 这 个 目的 ， 
我 们 依然 使 用 CREATE TABLE， 但 语法 稍 有 不 同 。 


现在 假设 我 们 决定 创建 一 个 新 表 ， 用 于 保存 每 种 鸟 的 详细 信息 〈 比 如 迁徙 模式 、 习 性 ， 等 
等 )。 我 们 打算 让 新 表 拥 有 birds 表 的 description 列 及 其 数据 。 也 就 是 说 ， 我 们 要 创建 
一 个 新 表 ， 并 把 该 列 的 设 定 和 数据 ， 以 及 bird_id 复制 进去 。 具 体 可 在 mysql 中 使 用 以 下 
命令 : 

CREATE TABLE birds_details 


SELECT bird id, description 
FROM birds; 


这 就 基于 birds 表 的 两 列 ， 创 建 了 含有 相同 列 的 birds_details 表 。 与 此 同时 ， 它 还 从 
birds 表 复 制 了 那 两 列 的 数据 到 birds_details 表 。 这 里 有 一 个 细小 的 、 但 必须 注意 的 
区 别 ， 就 是 AUTO_INCREMENT 的 设 定 方式 不 同 于 之 前 的 例子 。 现 在 用 DESCRIBE 来 看 看 这 
一 区 别 : 


DESCRIBE birds_details; 
















































































+------------- +--------- +------ +----- +--------- +------- 十 
| Field | Type | Null | Key | Default | Extra | 
+---- +--------- +------ +----- +--------- +------- 十 
| bird_id | int(11) | NO | | 0 | | 
| description | text | YES | | NULL | | 
+------------- +--------- +------ +----- +--------- +------- 十 


区 别 在 于 ， 这 里 的 bird_id 没有 使 用 AUTO_INCREMENT。 这 是 对 的 ， 我 们 就 是 要 为 每 一 行 
手工 设置 btrd_id 的 值 。 不 是 每 一 种 岛 都 有 详细 信息 ， 另 外 ， 亦 无 必要 在 了 录入 birds 表 
的 同时 录入 birds_details 表 。 我 们 确实 可 以 为 birds_details 表 的 bird id 加 上 AUTO_ 
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INCREMENT， 但 这 会 造成 问题 需要 与 birds 表 的 录入 顺序 一 致 ， 这 没有 道理 。 如 果 只 是 
为 了 让 birds_details 表 的 bird_id 不 重复 ， 可 以 使 用 ALTER TABLE 给 其 加 上 UNIQUE。 这 就 
能 使 一 种 久 只 有 一 个 描述 ， 那 挺 好 的 。 具 体会 在 5.4 节 讲 解 。 


CREATE TABLE.. .SELECT 语句 建立 了 拥有 两 列 的 birds_details 表 。 尽 管 如 此 ， 但 我 们 还 想 
要 更 多 列 来 保存 鸟 的 信息 。 所 以 ， 在 本 章 结 尾 的 习题 中 ， 我 们 会 使 用 ALTER TABLE 再 增加 
一 些 列 。 现 在 ， 先 用 以 下 命令 删 掉 birds 表 的 description 列 : 


ALTER TABLE birds 
DROP COLUMN description; 


这 将 删除 该 列 及 其 中 数据 。 所 以 ， 使 用 时 请 小 心 。 该 子 句 会 在 第 6 章 详解 。 


5.3.4 重 命名 一 个 表 


之 前 的 几 节 介绍 过 怎样 修改 表 里 的 列 ， 甚 中 包括 重 命名 列 。 但 有 时 候 ， 可 能 你 还 想 重 命名 
表 。 原 因 可 能 有 很 多 种 ， 例 如 你 想 把 列 名 改 成 更 直 白 的 名 称 。 你 甚至 可 以 用 它 来 进行 表 的 
置换 ， 即 删 掉 一 个 表 ， 然 后 让 另 一 个 表 使 用 被 柚 表 的 名 字 。 上 一 市 中 的 一 些 例子 就 需要 这 
种 做 法 。 


我 们 在 test 数据 库 中 建立 了 birds_new 表 。 我 们 计划 修改 该 表 ， 然 后 从 rookery 数据 库 删 
掉 birds 表 ， 最 后 以 test 的 btrds_new 表 作为 替代 。 为 了 完全 地 取代 birds 表 ， 这 里 我 们 
会 将 btrds_new 表 重 命名 为 btrds。 这 是 ALTER TABLE 无 法 做 到 的 ， 因 为 它 只 能 用 于 修改 表 
结构 ， 而 不 能 重 命名 表 。 相 反 ，RENAME TABLE 则 做 得 到 。 不 过 先 别 开 工 。 先 看 看 以 下 这 个 
重 命名 表 的 通用 例子 。 看 看 就 好 ， 不 要 执行 : 


RENAME TABLE table1 altered 
TO tablel; 


这 条 SQL 语句 会 将 table1_altered 重 命 名 为 table1。 它 假设 数据 库 中 没有 一 个 吊 tablel 
的 表 。 不 过 就 算 有 ， 它 也 不 会 重 写 table1， 而 只 会 给 你 一 个 错误 信息 ， 并 i tablel_ 
altered 维持 原样 。 


RENAME TABLE 语句 还 可 用 于 将 表 移 到 另 一 个 数据 库 中 。 如 果 你 在 一 个 数据 库 中 建 了 一 个 
表 ， 就 像 我 们 之 前 在 test 数据 库 中 建 了 birds_new 表 那 样 ， 而 现在 又 想 将 它 放 到 另 一 个 数 
据 库 中 ， 那 么 这 个 命令 就 能 帮 上 忙 了 。 因 为 RENAME TABLE 可 以 同时 改 表 名 和 移动 表 ， 所 以 
我 们 不 是 按照 上 例 的 语法 来 操作 birds_new。( 顺 便 说 一 下 ， 移 动 表 而 不 改 表 名 是 可 以 的 。 
你 只 需 将 新 库 名 后 接 相同 的 表 名 。) 在 我 们 的 例子 中 ， 你 需要 先 删 除 或 重 命名 rookery 数据 
库 中 那个 没 被 修改 的 表 。 通 常 给 它 重 命名 是 比较 安全 的 做 法 ， 所 以 我 们 就 这 么 做 。 
先 将 rookery 数据 库 中 的 birds 表 重 命名 为 birds_old， 然 后 将 test 数据 库 中 的 birds_new 
表 移 到 rookery， 并 同时 将 其 改名 为 btrds。 要 用 一 条 SQL 语句 来 完成 这 些 改动 ， 可 以 这 
样 写 : 

RENAME TABLE rookery.birds TO rookery.birds old, 

test.birds new TO rookery.birds; 


如 果 在 修改 过 程 中 出 现 问题 ， 你 会 得 到 一 个 错误 信息 ， 并 且 不 会 实现 任何 修改 。 而 如 果 一 
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切 顺利 ， 你 就 会 在 rookery 数据 库 中 拥有 两 个 存放 鸟 种 信息 的 表 。 


现在 用 SHOw TABLES 来 看 看 rookery 数据 库 中 有 什么 表 。 我 们 只 想 查询 名 字 以 birds 开头 的 
表 ， 所 以 使 用 了 LIKE 子 句 和 通配符 %。 在 mysql 中 输入 : 


SHOW TABLES IN rookery LIKE 'birds%'; 








| birds | 
| birds_bill_shapes 

| birds_body_shapes 

| birds details 

| birds_new 

| birds_old 

| birds_wing_shapes 


其 中 birds 表 就 是 我 们 早先 在 test 数据 库 中 修改 过 的 birds_new 表 ， 而 原本 的 birds 表 已 
被 重 命名 为 birds_old。 结 果 中 的 其 他 表 是 本 章 前 面 建立 的 。 因 为 它们 的 名 字 也 是 [以 birds 
开头 ， 所 以 也 出 现在 结果 中 。 在 用 SELECT 查 过 你 没有 丢失 任何 数据 后 ， 你 可 能 就 想 删 掉 
birds_old 表 了 。 删 掉 birds_old 表 需 要 用 DROP TABLE 语句 。 具 体 命令 如 下 ， 但 别 输入 它 : 


DROP TABLE birds_old; 


5.3.5 重 排序 一 个 表 


用 于 从 表 中 获取 数据 的 SELECT 语句 ， 可 带 有 ORDER BY 子 句 ， 用 来 使 结果 集 有 序 显 示 。 这 
在 展示 数据 ， 尤 其 是 大 量 数据 时 ， 很 有 帮助 。 有 时 我 们 也 会 想 对 表 里 的 数据 重新 排序 ， 尽 
管 这 不 是 很 必要 。 你 可 以 对 那些 几乎 不 做 改动 的 表 ， 如 参考 表 ， 进 行 重 排序 。 有 时 这 会 使 
得 查询 更 快速 ， 不 过 通常 索引 也 能 做 到 ， 而 且 还 做 得 更 好 。 


举 个 例子 ， 如 果 你 访问 我 的 网 站 ,会 看 到 一 个 列举 国家 代码 的 表 。 我 们 可 能 会 用 这 个 表 来 
跟 网 站 的 会 员 连 接 ， 又 或 者 是 在 列 出 鸟 种 发 现 地 时 使 用 它 。country_codes 表 有 一 列 用 于 
存放 两 个 字符 的 国家 代码 ， 还 有 一 列 用 于 存放 国家 名 称 。 为 了 避免 给 每 行 会 员 或 鸟 种 输入 
完整 的 国家 名 称 ， 我 们 只 输入 国家 代码 (例如 ， 打 us 以 代表 United States of America)。 
该 表 已 经 按 国家 名 称 来 排序 了 ， 但 你 或 许 会 想 让 它 按 行 的 字母 序 来 排 。 又 或 者 你 想 在 增加 
了 一 个 争议 地 区 的 代码 和 名 称 后 ， 使 该 表 依 然 有 序 。 

























































































先 看 看 这 个 表 的 数据 是 怎样 的 。 在 mysql 中 输入 以 下 只 显示 前 三 行 数据 的 SELECT 语句 : 

SELECT * FROM country_codes 

LIMIT 3; 

+-------------- +---------------- 十 

| country_code | country_name | 

+-------------- +---------------- + 

| af | Afghanistan | 

| al | Albania | 
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如 你 所 见 ， 数 据 已 经 按 country_name 的 值 的 字母 序 排列 好 了 。 现 在 用 ALTER TABLE 及 其 
ORDER BY 子 句 ， 使 数据 按 country_code 来 重新 排列 。 也 许 你 并 不 是 真 的 想 这 么 排 ， 但 我 们 
还 是 来 做 做 ， 以 便 体验 一 下 ORDER BY 子 句 的 效果 。 在 改 完 之 后 ， 我 们 可 以 把 它 再 改 回来 。 
在 mysql 中 输入 以 下 命令 : 


ALTER TABLE country_codes 
ORDER BY country_code; 


这 应 该 很 快 能 执行 完 。 现 在 再 次 用 SELECT， 并 只 显示 前 三 行 数据 : 


SELECT * FROM 
country_codes LIMIT 3; 
























































+--- +---------------------- 十 
| country_code | country_name | 
+-------------- +---------------------- 十 
| ad | Andorra | 
| ae | United Arab Emirates | 
| af | Afghanistan | 
+--- +---------------------- 十 

















我 们 注意 到 ， 虽 然 没 在 SELECT 中 指定 顺序 ， 但 结果 不 同 了 ， 现 在 这 些 行 以 country_code 
来 排序 。 若 要 将 它们 改 回 按 cpry ne 来 排序 ， 可 再 次 使 用 ALTER TABLE， 但 指定 
country_name 列 ， 而 非 country_code 列 。 


再 说 一 次 ， 重 排序 一 个 表 几 乎 是 没有 必要 的 。 因 为 我 们 还 可 以 用 SELECT 再 加 上 ORDER BY 
来 排序 : 


SELECT * FROM country_codes 
ORDER BY country_name 
LIMIT 3; 


这 条 SQL 语句 出 来 的 结果 与 之 前 的 SELECT 一 样 ， 而 且 在 速度 上 几乎 没有 差别 。 


5.4 索引 


对 于 新 手 来 说 ，ALTER TABLE 烦人 的 用 法 之 一 ， 就 是 用 来 修改 索引 了 。 如 果 你 只 用 ALTER 
TABLE 来 重 命 名 一 个 索引 列 ， 就 会 得 到 一 个 令 人 困惑 的 错误 信息 。 例 如 ， 0 oo 
conservation_status 表 的 主键 列 status_id 改名 为 conservation_status_id。 你 可 能 会 写 
这 样 的 SQL 语句 : 


ALTER TABLE conservation_status 
CHANGE status_id conservation_status_id INT AUTO_INCREMENT PRIMARY KEY; 














ERROR 1068: Multiple primary key defined 


刚 开 始 这 么 做 时 ， 你 可 能 会 以 为 自己 记 错 了 语法 。 于 是 你 开始 尝试 其 他 组 合 ， 但 最 后 无 论 
怎样 都 不 行 。 想 避免 这 种 错误 ， 一 次 就 做 好 ， 你 :需要 对 索引 有 更 深入 的 理解 ， 明白 索引 与 














其 所 基于 的 列 是 分 离 的 。 

索引 的 作用 就 是 令 MySQL 能 快速 地 定位 数据 。 它 们 的 作用 就 像 一 本 书后 面 的 索引 。 对 比 
以 下 各 种 在 书 中 搜索 内 容 的 方法 。 例 如 ， 假 设 你 想 查 找 ALTER TABLE 语法 的 相关 内 容 ， 你 
可 以 从 头 开始 ， 快 速 地 翻 页 ， 一 页 页 地 查看 一 一 如 果 你 看 的 是 纸 质 版 一 一 直到 找到 ALTER 
TABLE 的 字眼 。 这 就 是 不 使 用 索引 来 查找 数据 。 除 此 之 外 ， 你 还 可 以 翻 看 本 书 开头 的 目录 ， 
它 就 是 一 个 很 宽泛 的 索引 ， 查 找 名 为 “更 改 表 ”的 章节 ， 然 后 在 这 些 章节 里 ， 更 进一步 地 
在 标题 含有 相关 字眼 的 地 方 查找 。 这 就 是 一 个 简单 索引 的 例子 。 如 果 想 更 准确 地 查找 ， 那 
么 可 以 去 到 本 书后 面 的 索引 ， 看 看 含有 ALTER TABLE 的 书页 有 哪些 ， 然 后 直接 到 这 些 页 码 
中 阅读 。 

MySQL 的 索引 与 上 面 最 后 一 个 例子 类 似 。 如 果 没 有 索引 ，MySQL 就 需要 一 行 行 去 搜索 。 
因为 索引 的 体积 更 小 ， 而 且 已 经 组 织 好 以 便 快 速 遍历 ， 所 以 MySQL 可 以 通过 它 快 速 定 位 
数据 ， 然 后 直接 跳 到 相应 的 行 的 位 置 。 所 以 ， 创 建 表 时 ， 尤 其 是 创建 会 拥有 大 量 行 的 表 
时 ， 请 顺便 创建 索引 。 这 样 数据 库 会 跑 得 更 快 。 

记 住 了 书本 索引 这 个 比喻 ， 你 应 该 能 理解 索引 不 是 列 ， 尽 管 它 与 列 有 关 。 为 了 在 表 中 演示 
这 一 点 ， 我 们 用 SHOW INDEX 语句 来 看 看 第 4 章 所 建立 的 humans 表 。 在 mysql 中 输入 以 下 


命令 ， 


SHOW INDEX FROM birdwatchers .humans \G 







































































类 火炎 火 火 淡淡 火炎 类 火炎 类 火炎 火炎 火炎 火炎 淡 火 火炎 火 尖 4 row 类 淡淡 火 火 淡淡 火炎 类 火炎 淡淡 火 尖 火 火 炎炎 火炎 火炎 炎炎 类 
Table: humans 
Non_unique: 0 
Key_name: PRIMARY 
Seq_in index: 1 
CoLumn_name: human_id 
Collation: A 
Cardinality: 0 
Sub_part: NULL 
Packed: NULL 
Null: 
Index_type: BTREE 
Comment: 


结果 显示 ， 有 一 个 索引 与 human_id 列 相关 (注意 Column_name 处 )。human_id 不 是 索引 ， 
它 是 索引 的 根源 。 它 的 名 字 与 索引 的 名 字 相 同 ， 而 且 索 引 也 与 这 一 列 绑 定 ， 但 它们 绝 不 等 
同 。 现 在 我 们 改 改 这 个 表 ， 并 增加 一 个 索引 ， 来 进一步 理解 这 个 概念 。 
假设 用 户 有 时 会 按 会 员 的 姓氏 来 检索 humans 表 。 如 果 没 有 索引 ， 那 么 MySQL 就 会 一 行 行 
地 查找 匹配 的 姓氏 。 我 们 可 通过 在 SELECT 前 加 上 EXPLAIN， 来 确认 是 否 是 这 样 。 它 会 告知 
我 们 SELECT 是 基于 什么 来 进行 查找 的 ， 即 向 我 们 解释 ， 在 执行 SELECT 时 ， 服 务 器 做 了 什 
么 一 一 所 以 它 不 返回 任何 表 内 的 数据 ， 而 是 返回 索引 被 如 何 利用 的 相关 信息 。 在 mysql 中 
输入 以 下 命令 : 

EXPLAIN SELECT * FROM birdwatchers.humans 

WHERE name_Last = 'HoLLar' \G 
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类 淡淡 淡 火 火炎 火炎 类 火炎 类 火 火 尖 类 火炎 淡 火 大火 火 类 类 类 和 至， row 类 淡淡 火炎 淡 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 炎炎 火炎 类 类 
Td 1 
select type: SIMPLE 
table: humans 
type: ALL 
possible_ keys: NULL 
key: NULL 
key_len: NULL 
ref: NULL 
rows: 4 
Extra: Using where 


这 里 的 SELECT 语句 在 查 name_last 为 Hollar 的 行 的 所 有 列 ， 而 EXPLAIN 语句 则 对 其 进行 分 
析 。 分 析 结 果 中 ， 我 们 感 兴趣 的 有 possible_key 列 和 key 列 一 一 key 的 意思 是 表 按 哪 列 进 
行 索 引 。 而 key 和 索引 一 般 是 同一 个 意思 。possible_key 表示 SELECT 语句 本 应 用 到 的 键 。 
在 我 们 这 个 例子 中 ，name_last 是 没有 索引 的 。key 会 列 出 语句 实际 用 到 的 索引 。 而 在 本 
例 中 ， 它 显示 NULL。 因 为 现在 表 中 只 有 四 行 ， 所 以 有 没有 索引 都 不 会 带 来 明显 的 性 能 区 
别 。 然 而 ， 如 果 有 一 天 表 中 有 了 数 千 行 数据 ， 那 么 索引 将 大 大 提升 查找 人 名 的 效率 。 

有 时， 用 户 不 只 会 按 姓 来 查询 humans 表 ， 他 们 还 会 按 名 来 查 ， 甚 至 姓名 一 起 查 。 为 了 对 这 
些 可 能 性 有 所 准备 ， 以 及 提升 数据 量 增长 后 的 查询 性 能 ， 我 们 在 这 两 列 上 建立 索引 。 有 具体 
做 法 是 , 使 用 ALTER TABLE 加 ADD INDEX 子 句 ， 就 像 这 样 : 


ALTER TABLE birdwatchers.humans 
ADD INDEX human_names (name_last, name_first); 


接着 ， 从 SHOW TABLE 语句 的 结果 中 看 看 该 索引 长 什么 样 : 


SHOW CREATE TABLE birdwatchers.humans \G 
























































下 


类 淡淡 火 火 淡淡 类 尖 类 淡淡 火 火 火 火炎 类 尖 炎炎 火炎 火炎 火炎 bp row 兴 兴 兴 光 光 炎 火光 大 火炎 火炎 火光 大 炎炎 天 大火 类 天 类 类 大 大 


Table: humans 

Create Table: CREATE TABLE ‘humans. ( 
`human_ id ”int(11) NOT NULL AUTO_INCREMENT ， 
`“formaL_titLe ”varchar(25) COLLATE Latin1_bin DEFAULT NULL， 
"name_first ”varchar(25) COLLATE Latin1_bin DEFAULT NULL, 
"name_Last varchar(25) COLLATE Latin1_bin DEFAULT NULL, 
“emaiL_address`” varchar(255) COLLATE Latin1_bin DEFAULT NULL， 
PRIMARY KEY (“human_id.), 
KEY ‘human_names. (‘name_last’, ‘name_first’) 

) ENGINE=MyISAM DEFAULT CHARSET=Latin1 COLLATE=Latin1_bin 


这 次 ， 在 那 堆 列 的 下 面 出 现 了 一 个 新 的 KEY。 这 个 键 ， 或 者 索引 ， 叫 humans_nanes， 它 是 
根据 括号 中 提 到 的 两 列 的 值 来 建立 的 。 下 面 我 们 用 SHOW INDEX 来 查看 更 多 关于 它 的 信息 : 


SHOW INDEX FROM birdwatchers.humans 
WHERE Key_name = 'human_names' \G 





类 淡淡 火 火 淡淡 大 类 类 淡淡 火 火 火 火炎 类 尖 炎炎 炎炎 火炎 火炎 1. row 类 淡淡 炎炎 淡淡 淡淡 火 火炎 类 尖 炎炎 火炎 火炎 类 类 类 大业 炎炎 


Table: humans 
Non_unique: 1 
Key_name: human_names 
Seq_in index: 1 





CoLumn_name : 
Collation: 
Cardinality: 
Sub_part: 
Packed: 
Null: 
Index_type: 
Comment: 


类 淡淡 淡淡 火炎 炎炎 类 类 炎炎 火炎 火炎 类 大 大 大 大 大火 火 火 类 要 


Table: 
Non_unique: 
Key_name : 
Seq_in_index: 
CoLumn_name : 
Collation: 
Cardinality: 
Sub_part: 
Packed: 
Null: 
Index_type: 
Comment: 





上 男 











name_last 
A 

NULL 

NULL 

NULL 

YES 

BTREE 


row 类 淡淡 火 火 火炎 类 尖 类 炎炎 火 火 火 火 火炎 大 炎炎 火炎 火炎 炎炎 


humans 

1 
human_names 
2 
name_first 
A 

NULL 

NULL 

NULL 

YES 

BTREE 


ij 这 名 展示 了 human_names 索引 的 组 成 。 结 果 有 两 行 ， 行 中 有 多 列 ， 它 们 展示 这 个 索引 


是 如 何 建立 的 。 这 里 有 很 多 关于 这 个 索引 的 信息 ， 但 在 这 个 阶段 ， 你 还 没 必 要 掌握 它 的 全 


部 含义 。 现 在 我 只 想 让 你 看 到 ， 索 引 与 它 依 赖 的 列 的 名 字 不 同 。 即 使 索引 只 根据 一 列 建 


立 ， 而 且 索 引 名 与 列 名 相同 ， 也 不 代表 索引 和 列 是 同一 个 东西 。 
我 们 可 以 再 跑 一 次 EXPLAIN.. .SELECT， 看 看 跟 之 前 没 加 索引 的 有 什么 区 别 : 


EXPLAIN SELECT * FROM birdwatchers.humans 
WHERE name_Last = 'HoLLar' \G 


类 淡淡 淡淡 火炎 火炎 类 类 淡淡 火 火 火 火炎 大 大 类 大火 火 火 火 类 1. row 类 淡淡 火 火 火炎 大大 类 淡淡 火 火 火 火炎 炎 大 炎炎 火炎 火炎 炎炎 


id: 

select type: 
table: 

type: 
possible_keys: 
key: 

key_len: 

ref: 

rows: 

Extra: 

















1 

SIMPLE 
humans 

ref 
human_names 
human_names 
28 

const 

1 

Using where 





如 结果 所 示 ， 这 次 possible_keys 域 显示 可 以 用 human_names 键 。 如 有 果 可 能 用 到 的 键 不 止 一 


个 ， 那 么 它们 都 会 在 这 里 列 昌 














日 。 而 在 key 域 ， 我 们 看 到 human_names 确实 被 用 上 了 。 基 本 


上 ， 只 要 用 户 按 姓 来 查找 ， 那 么 MySQL 都 会 使 用 human_names， 而 不 会 在 表 中 逐 行 搜索 。 
这 也 正 符合 我 们 的 目的 一 一 使 查询 变 得 更 快 。 


既然 现在 你 已 经 更 好 地 型 




















E 解 了 索引 以 及 它 与 列 的 关系 ， 那 么 我 们 就 回 


conservation_status 表 的 status_id 列 改名 为 conservation_status_id 





到 之 前 的 任务 ， 将 
。 因 为 索引 与 列 关 











联 ， 所 以 我 们 需 先 将 这 个 关联 去 掉 。 否 则 ， 索 引 就 会 与 一 个 不 存在 的 允 


| 关联 : 因为 它 记 住 
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的 仍然 是 旧 的 列 名 。 于 是 ， 我 们 先 删 掉 索 引 ， 再 改 列 名 ， 最 后 基于 新 的 列 名 来 建立 索引 。 
即 在 mysql 中 输入 以 下 SQL 语句 : 
ALTER TABLE conservation_status 


DROP PRIMARY KEY ， 
CHANGE status_ id conservation_status_id INT PRIMARY KEY AUTO_INCREMENT; 


注意 这 些 子 句 的 顺序 必须 如 上 所 示 ， 因 为 索引 与 该 列 关 联 ， 该 列 要 在 索引 删除 后 才能 

命名 。 你 无 需 担心 丢失 数据 : 列 中 的 数据 并 没有 删除 ， 只 有 索引 被 删除 了 ， 而 紧 接着 ， 
MySQL 会 很 轻易 地 将 它 重 建 。 删 除 PRIMARY KEY 时 ， 不 需要 给 出 它 所 关联 的 列 名 。 主 键 有 
只 有 一 个 。 

至 此 ， 你 应 该 对 索引 ， 以 及 使 用 ALTER TABLE 修改 索引 的 过 程 有 了 更 深入 的 认识 。 修 改 索 
引 和 它 所 依赖 的 列 ， 是 有 先后 次 序 的 。 其 中 的 道理 ， 你 现在 应 该 清楚 了 。 不 过 ， 在 本 章 结 
尾 的 习题 中 ， 我 还 是 要 考 考 你 ， 我 会 让 你 再 修改 一 些 列 和 索引 ， 以 帮助 你 熟 习 这 些 概念 和 
语法 。 请 记得 完成 所 有 练习 。 


5.5 ”小结 


好 的 规划 对 于 数据 库 开 发 固然 重要 。 然 而 ， 在 以 上 那些 使 用 ALTER TABLE 的 例子 里 ， 我 们 
也 看 到 了 ，MySQL 具备 了 足够 的 可 塑性 ， 它 的 数据 库 和 表 都 能 轻易 地 更 改 。 你 只 需 注意 
在 重 构 前 做 好 数据 备份 ， 并 且 在 副本 上 进行 改动 。 最 后 ， 检 查 清楚 你 的 作业 和 数据 ， 再 提 
交 结 果 。 

记 住 了 这 些 知识 ， 以 及 尝试 过 本 章 的 改 表 例子 之 后 ， 你 应 该 对 建 表 感到 毫 无 压力 ， 因 为 你 
已 经 知道 了 没有 必要 在 一 开始 就 建 得 很 完美 。 你 还 应 该 十 分 清楚 列 的 备 种 选项 ， 以 及 如 何 
设置 它们 。 此 外 ， 你 还 应 基本 了 解 了 索引 ， 以 及 如 何 创建 、 修 改 和 使 用 它们 。 

如 果 对 本 章 还 有 疑问 ， 可 能 你 还 需要 多 接触 一 些 带 有 数据 的 表 。 在 本 书 的 下 一 部 分 ， 你 
会 有 大 量 机 会 与 表 打 交道 ， 包 括 插 入 数据 和 修改 数据 。 当 数据 来 到 你 面前 时 ， 你 会 更 加 
懂得 如 何 为 数据 准备 好 表 和 列 。 你 还 会 更 好 地 认识 到 如 何 进行 多 表 连 接 ， 以 得 出 你 想 要 
的 结果 。 


5.6 习题 


除了 你 在 本 章 输入 过 的 SQL 语句 ， 这 里 还 给 出 了 一 些 习 题 ， 来 巩固 你 刚刚 学 到 的 知识 。 

这 些 题 都 跟 建 表 和 改 表 相关 。 最 终 产生 的 表 会 在 后 面 的 章节 用 到 。 所 以 ， 一 定 要 完成 这 些 

练习 。 

(1) 在 本 章 的 前 面 ， 我 们 建 了 一 个 叫 birds_details 的 表 。 该 表 有 两 列 : bird_id 和 
description。 它 们 是 从 birds 表 中 拿 出 来 的 。 建 立 此 表 的 目的 是 增加 列 来 存放 各 种 鸟 
的 描述 ， 记 录 它 们 的 迁 徒 习性、 生活 区 域 ， 以 及 提供 关于 如 何在 野外 识别 它们 的 有 用 信 
息 。 现 在 我 们 来 增加 些 列 ， 以 保存 这 些 信息 。 

使 用 ALTER TABLE 来 修改 此 表 。 要 求 只 写 一 条 SQL 语句 ， 它 能 增加 两 列 ， 分别 叫 
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migrate 和 bird_feeder， 都 是 整数 类 型 (INT)。 它 们 用 于 存放 1 或 0 ( 即 是 或 否 )。 另 
外 ， 在 这 同一 条 语句 中 ， 还 要 使 用 CHANGR COLUMN 子 句 ， 将 description 改名 为 bird_ 
description, 
修改 完 后 ， 用 SHOW CREATE TABLE 看 看 结果 。 

(2) 用 CREATE TABLE 语句 创建 一 个 叫 habitat_codes 的 参考 表 。 该 表 有 两 列 : 第 一 列 是 
habit_id， 它 是 主键 ， 需 要 AUTO_INCREMENT， 类 型 是 INT， 第 二 列 是 habitat， 类 型 是 
VARCHAR(25)。 然 后 用 以 下 语句 插入 数据 : 


INSERT INTO habitat codes (habitat) 
VALUES('Coasts'), ('Deserts'), ('Forests'), 
('Grasslands'), ('Lakes, Rivers, Ponds'), 
('Marshes, Swamps'), ('Mountains'), ('Oceans'), 
('Urban'); 


执行 一 个 SELECT 语句 来 确认 数据 正常 插入 。 该 结果 应 如 下 


i 
| habitat_id 
a 


dA i 
habitat | 


* 
| 

+ 

| Coasts | 
| Deserts | 
| Forests | 
| Grasslands | 
| Lakes, Rivers, Ponds | 
| Marshes, Swamps | 
| Mountains | 
| | 
| | 
+ 


‘DOOD 


Ep 戈 二 全 二 


再 创建 一 个 bird_habitats 表 。 第 一 列 叫 bird id， 第 二 列 叫 habitat id。 两 列 类 型 都 
为 INT。 两 列 都 不 需要 索引 。 
建 好 这 两 个 表 后 ， 用 DESCRIBE 和 SHOW CREATE TABLE 来 展示 它们 。 注 意 展示 的 结果 ， 认 
清 这 两 个 表 的 结构 和 各 列 的 组 成 。 
使 用 RENAME TABLE 将 bird_habitats 重 命名 为 btrds_habitats。 这 个 命令 在 5.3.4 节 中 
讲 过 。 

(3) 用 ALTER TABLE 来 给 btrd_id 和 habitat_id 建 个 组 合 索 引 (5.4 节 中 讲 过 )。 我 们 不 用 
INDEX 关键 字 ， 而 用 UNIQUE， 使 其 不 重复 。 这 个 索引 名 为 btrds_habitats。 
改 完 后 用 SHOW CREATE TABLE 查看 。 
到 此 ， 是 时 候 给 birds_habitats 表 添 加 一 些 数据 了 。 用 以 下 语句 ， 看 看 birds 和 habit_ 
codes 都 有 些 什么 数据 : 


SELECT bird id, common_name 
FROM birds; 


























SELECT * FROM habitat_codes; 


第 一 个 语句 的 结果 应 该 含有 loon 和 duck， 以 及 其 他 鸟 。loon 和 duck 都 是 可 以 在 湖 中 找 
到 的 ， 其 中 duck 还 可 以 在 沼泽 中 找到 。 所 以 ，birds_habitats 表 中 需要 有 一 行 loon 和 
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两 行 duck。loon 的 那 行 ， 用 loon 的 btrd_id 和 Lakes, Rivers, Ponds 的 habitat_id。 然 
后 ，duck 的 一 行 ， 是 duck 的 bird_id 和 Lakes, Rivers, Ponds 的 habitat_id。 接 着 ， 再 
来 一 行 duck， 但 habitat_id 用 Marshes, Swamps 的 。 如 果 你 建 的 索引 正确 ， 那 应 该 是 
没有 报错 说 记录 重复 的 。 做 完 之 后 ，SELECT 出 结果 来 看 看 。 

(用 ALTER TABLE 来 给 上 一 题 的 birds_habitats 索引 改名 (这 在 本 章 临近 尾声 的 地 方 介绍 
过 )。 将 其 改名 为 bird_habitat。 

(5) 再 次 使 用 ALTER _ TABLE， 给 birdwatchers 数据 库 的 humans 表 增 加 三 列 ， 并 且 用 同一 语 
句 完成 。 一 列 是 country_id， 用 于 存放 两 个 字符 的 国家 代码 ， 以 示 每 个 会 员 的 所 在 地 。 
接着 是 membership_type 列 ， 用 于 存放 枚 举 值 basic 和 premium。 第 三 列 是 membership_ 
expiration， 类 型 是 DATE， 以 便 我 们 得 知 premium 用 户 何 时 过 期 。premium 用 户 在 网 站 
中 拥有 特权 ， 而 且 在 购买 观 鸟 用 品 时 享有 优惠 。 


















































第 三 部 分 


数据 处 理 基础 








数据 库 的 主要 用 途 就 是 处 理 数据 。 在 第 二 部 分 中 ， 你 已 经 学 习 了 如 何 建 表 和 改 表 。 而 数据 
处 理 方 面 的 知识 ， 也 跟 之 前 的 内 容 一 样 ， 是 有 趣 并 且 必 要 的 。 如 果 你 在 之 前 章节 的 建 表 和 
改 表 操作 中 感到 疑惑 ， 那 可 能 是 因为 你 缺乏 插入 数据 的 经 验 ， 所 以 难以 想象 表 和 列 与 数据 
的 关系 。 


在 这 一 部 分 中 ， 我 们 将 会 探索 几 种 将 数据 插入 数据 库 和 表 的 基本 方法 。 这 些 会 在 第 6 章 介 
绍 。 插 入 数据 主要 使 用 INSERT 语句 。 而 从 表 中 歼 取 数据 则 使 用 SELECT 语句 ， 这 会 在 第 7 
章 详 细 介绍 。 在 之 前 的 章节 中 ， 我 们 其 实 已 经 使 用 它们 好 多 次 了 。 不 过 ， 在 接 下 来 的 两 章 
中 ， 你 会 学 到 更 多 ， 包 括 它们 的 各 种 语法 和 选项 。 另 外 ， 我 还 为 你 准备 了 大 量 的 练习 。 


除 此 之 外 ， 数 据 还 经 常 需要 更 改 其 至 删除 ， 所 以 ， 在 第 8 章 中 ， 我 们 会 介绍 如 何 更 新 和 删 
除数 据 。 该 章 会 讲述 怎样 使 用 UPDATE 和 DELETE 语句 ， 来 完成 这 些 常见 的 工作 。 它 们 对 于 
数据 管理 是 十 分 重要 的 。 

而 本 部 分 的 最 后 一 章 ， 即 第 9 章 ， 讲 述 的 是 更 高 级 的 问题 。 它 虽然 并 不 算 很 难 ， 但 你 也 不 
应 该 随便 对 待 。 有 具体 来 说 ， 就 是 介绍 如 何 从 一 个 或 多 个 表 中 选取 数据 ， 并 以 这 些 数据 为 基 
础 ， 在 其 他 表 中 进行 插入 、 选 取 、 更 新 或 删除 操作 。 因 此 ， 在 读 第 9 章 之 前 ， 你 应 确保 自 
己 已 经 掌握 了 前 面 章 节 的 基础 知识 。 


本 部 分 的 各 章 都 有 一 些 示 例 代 码 ， 用 于 解释 各 种 SQL 语句 及 相关 参数 。 这 些 你 都 应 该 输入 
一 过 。 即 使 你 看 的 书 是 电子 版 ， 我 也 强烈 建议 你 手工 输入 。 这 看 上 去 好 像 是 一 件 小 事 ， 但 
其 实 它 能 帮助 你 学 习 和 记忆 各 种 SQL 语句 的 语法 和 差异 。 当 你 用 错 命令 或 打 错字 时 ， 会 得 
到 报错 信息 。 而 分 析 这 些 报错 信息 ， 也 是 进步 的 途径 。 如 果 你 只 是 将 我 呈现 给 你 的 东西 复 
制 粘贴 进 命令 行 ， 那 么 你 就 只 是 在 给 本 书 的 示例 勘误 ， 这 是 学 不 到 多 少 东西 的 。 如 果 在 学 
习 过 程 中 没有 遇 到 挫折 ， 是 比较 轻松 的 。 而 手 融 代码 虽然 比较 辛苦， 但 敢于 犯错 并 分 析 问 
题 ， 才 能 让 你 学 到 更 多 。 
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就 跟 本 书 的 大 多 数 章 市 一 样 ， 本 部 分 的 每 一 章 结尾 都 有 习题 。 就 像 我 建议 你 敲打 示例 


代码 一 样 ， 你 同样 应 该 完成 这 些 练习 。 本 上 





MariaDB 的 工具 。 为 了 实现 这 个 学 习 目 标 ， 





不 只 是 用 于 阅读 ， 它 还 是 你 学 习 MySQL 和 
你 不 应 仅仅 只 是 读书 ， 还 应 参与 、 实 验 和 钻 








研 。 如 有 果 你 真 的 这 么 做 ， 那 么 将 会 从 本 书 获 益 良 多 。 这 些 课 后 习题 可 能 是 本 书 最 关键 的 部 


分 ， 所 以 你 应 努力 地 完成 它们 。 








第 6 章 


插入 数据 











建立 了 数据 库 和 表 之 后 ， 下 一 步 就 是 插入 数据 了 。 这 里 使 用 播 入 这 个 词 ， 是 因为 往 表 中 输 
入 数据 的 最 常用 、 最 基本 的 方式 ， 就 是 使 用 INSERT 这 条 SQL 语句 。 用 关键 字 来 指 代 所 做 
的 事情 ， 能 让 你 更 轻松 地 学 习 MySQL 和 MariaDB 的 语言 。 本 章 将 讨论 INSERT 的 各 种 语法 
和 选项 ， 其 中 会 用 到 在 第 4 章 创建 过 的 表 ， 以 及 在 第 $ 章 更 改过 的 表 。 除 此 之 外 ， 我 们 还 
会 研究 一 些 获 取 或 选择 数据 的 相关 命令 ， 这 些 命令 会 在 第 7 章 进 行 更 详细 的 介绍 。 

在 阅读 本 章 的 过 程 中 ， 你 还 应 该 动手 操作 。 当 看 到 有 INSERT 或 其 他 语句 的 示例 代码 时 ， 你 
都 应 该 试 着 用 mysql 客户 端 输入 它们 。 而 本 章 结尾 的 习题 ， 你 也 应 该 做 做 。 在 做 题 过 程 中 ， 
尔 可 能 需要 回顾 本 章 和 第 4 章 中 的 一 些 示例 。 这 能 加 深 你 对 所 学 知识 的 印象 。 做 完 之 后 ， 
尔 就 能 够 轻松 自如 地 在 MySQL 和 MariaDB 里 插入 数据 了 。 


6.1 语法 
INSERT 语句 可 向 表 中 添加 多 行 数据 ， 可 以 一 次 一 行 ， 也 可 以 一 次 多 行 。 它 的 基本 语法 
如 下 : 


INSERT INTO table [(column, ...)] 
VALUES (vaUWE oD (. wat) os 


关键 字 INSERT INTO 后 接 一 个 表 名 ， 然 后 是 括号 中 可 选 的 列 的 集合 。 ( 方 括号 意味 着 其 中 的 
内 容 是 可 选 的 )。 再 接着 是 关键 字 VALUES， 以 及 用 括号 包围 的 对 应 各 列 的 值 的 集合 。INSERT 
还 有 其 他 不 同 的 语法 ， 而 现在 说 的 这 种 是 最 基本 的 。 还 有 ， 过 号 是 用 于 分 隔 的 ， 如 区 分 列 
名 或 各 列 的 值 。 


现在 我 们 用 一 些 例子 来 演示 INSERT 的 儿 个 更 简单 的 语法 。 你 不 用 输入 它们 ， 因 为 这 些 例子 
用 到 的 表 都 是 我 们 没 创建 过 的 。 
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以 下 这 个 例子 所 涉及 的 语法 是 最 简单 的 : 


INSERT INTO books 
VALUES('The Big Sleep', 'Raymond Chandler', '1934'); 


此 命令 向 books 表 中 输入 了 一 些 数据 。 这 个 表 刚好 只 有 三 列 ， 所 以 我 们 不 用 指定 是 哪 三 
列 。 又 或 者 说 ， 因 为 没 指定 列 ， 所 以 我 们 必须 按 CREATE TABLE 时 列 的 顺序 ， 来 提供 这 三 列 
的 值 。 于 是 ， 在 这 个 例子 里 ，The Big Sleep、Raymond Chandler 和 1934 会 分 别 插入 第 一 、 
二 、 三 列 中 。 


对 于 那些 有 设置 默认 值 的 列 ， 你 可 以 忽略 该 列 的 值 ， 让 服务 器 来 帮 你 输入 。 一 种 做 法 是 ， 
在 该 列 的 位 置 上 使 用 DEFAULT 或 NULL， 如 下 : 


INSERT INTO books 
VALUES('The Thirty-Nine Steps', 'John Buchan', DEFAULT); 


这 样 MySQL 就 会 给 第 三 列 插入 默认 值 。 如 果 默 认 值 是 NULL 一 一 建 表 没 指定 默认 值 时 就 
是 NULL 一 一 那么 它 就 会 给 该 行 的 该 列 插入 NULL。 而 如 果 用 AUTO_INCREMENT 指定 了 一 
列 ， 那 么 服务 器 就 会 取 该 列 的 序列 的 下 一 个 数 来 插入 。 


使 用 默认 值 的 另 一 种 方法 是 ， 指 出 不 使 用 默认 值 的 列 ， 如 下 : 


INSERT INTO books 
(author, title) 
VALUES('EveLyn Waugh','Brideshead Revisited'); 


注意 此 例 我 们 用 括号 来 指定 了 两 列 ， 而 且 顺 序号 反 了 。 那 么 ， 在 给 值 时 ， 也 要 符合 这 个 顺 
序 。 而 第 三 列 ( 即 year) ， 就 使 用 到 默认 值 了 。 
如 果 你 有 多 行 需要 插入 ， 那 么 把 它们 都 写 在 一 条 语句 中 会 比较 高 效 。 这 种 语法 跟 之 前 的 稍 
微 不 同 。 你 需 写 多 几 对 包含 值 集 合 的 括号 ， 并 用 逗号 把 它们 分 隔 开 ， 如 下 : 

INSERT INTO books 

(title, author, year) 

VALUES('Visitation of Spirits','Randall Kenan','1989'), 


('Heart of Darkness','Joseph Conrad','1902'), 
('The Idiot','Fyodor Dostoevsky','1871'); 


这 就 输入 三 行 数据 到 books 表 了 。 注 意 ， 我 们 只 需 指定 列 一 次 ，VALUES 关键 字 也 只 写 了 
一 次 。 虽 然 子 句 后 可 跟 多 个 项 目 或 者 一 堆 列 表 ， 但 却 不 允许 出 现 重 复 的 子 句 (如 本 例 的 
VALUES)， 这 是 几乎 所 有 的 SQL 语句 都 遵守 的 规则 。 


6.2 ”实例 


现在 ， 回 到 第 4 章 和 第 5 章 操作 过 的 rookery 数据 库 ， 进 行 更 多 插入 数据 的 实验 。 如 果 你 
没有 创建 表 ， 那 么 请 回 过 头 去 创建 好 再 来 学 习 本 章 。 

通常 人 们 都 喜欢 先 往 主 表 中 添加 数据 ， 然 后 再 往 辅 表 或 参考 表 添 加 数据 ， 因 为 主 表 的 内 容 
比 参 考 表 有 趣 得 多 (但 总 的 来 说 ， 数 据 库 都 是 很 无 趣 的 ， 这 是 无 法 避免 的 )。 虽 然 先 插入 
主 表 也 没 问 题 ， 但 这 有 可 能 造成 数据 见 余 。 
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尽管 我 们 都 想 避 免 数 据 元 余 ， 但 我 还 是 建议 ， 想 要 输入 数据 时 再 建 表 ， 输 入 完 主 表 后 ， 才 
输入 辅 表 。 这 是 因为 我 们 很 难 一 开始 就 确定 到 底 需要 多 少 表 。 相 反 ， 数 据 库 开发 是 一 个 过 
程 ， 你 会 不 断 地 增加 表 ， 改 表 结 构 ， 甚 至 拆 分 表 以 改善 性 能 、 简 化 管理 。 而 且 也 正 是 这 
样 ， 才 使 得 数据 库 没 那么 乏味 ， 并 令 其 变 得 好 玩 。 

明白 这 个 道理 之 后 ， 在 以 后 输入 数据 时 ， 我 们 会 先 做 一 些 基本 判断 ， 以 决定 需要 什么 表 ， 
先 输入 哪些 表 。 先 回忆 一 下 我 们 是 如 何 对 鸟 进 行 分 类 的 : 鸟 种 属于 鸟 科 ， 鸟 科 属 于 鸟 目 。 
birds 表 需 要 用 family_id 与 bird_families 表 连 接 ，bird_famiLies 表 需 要 用 order_id 与 
bird_orders 表 连 接 。 所 以 ， 我 们 按 以 下 顺序 来 输入 数据 : bird_orders、bird_families 和 


birds, 

考虑 到 大 多 数 人 都 搞 不 清 鸟 种 、 乌 科 和 鸟 目的 学 名 ， 所 以 我 会 提供 一 些 例子 ， 让 你 能 先 插 
入 几 行 测试 数据 〈 当 然 你 也 可 以 到 维基 百科 和 专门 的 观 鸟 网 站 或 鸟 类 学 网 站 ， 去 查找 这 方 
面 的 信息 ， 但 学 习 本 书 不 需要 搞 得 这 么 复杂 )。 想 要 完整 的 数据 ， 则 可 从 我 的 网 站 (http:// 
mysqlresources.com/files) 下 载 。 


6.2.1 乌 目 表 


在 输入 数据 到 bird_orders 表 之 前 ， 让 我 们 通过 执行 以 下 SQL 语句 ， 来 回忆 一 下 该 表 的 
结构 : 


DESCRIBE bird_orders; 






























































+------------------- +-------------- +------ +----- +--------- +---------------- + 
| Field | Type | Null | Key | Default | Extra | 
+------------------- +-------------- +------ +----- +--------- +---------------- + 
| order_id | int(11) | NO | PRI | NULL | auto_increment | 
| scientific name | varchar(255) | YES | UNI | NULL | | 
| brief_description | varchar(255) | YES | | NULL | | 
| order_image | blob | YES | | NULL | | 
+------------------- +-------------- +------ +----- +--------- +---------------- 十 


如 你 所 见 ， 此 表 只 有 四 列 : 一 列 是 与 bird_families 表 关 联 的 标识 号 ， 一 列 是 岛 目的 学 名 ， 
一 列 是 岛 目的 描述 ， 还 有 一 列 是 该 鸟 目的 示例 图 。 其 中 的 order_id， 除 非 我 们 另外 指定 ， 
否则 会 从 1 开始， 并 为 以 后 插入 的 乌 目 往 上 递增 。 

在 输入 鸟 目 数据 之 前 ， 让 我 们 先 将 order_id 设 为 从 100 开始 起 跳 ， 这 样 得 到 的 标识 号 就 
至 少 是 三 位 数 了 。 该 数字 对 MySQL 是 没什么 意义 的 ， 这 只 是 一 种 个 人 喜好 。 设 置 的 方法 ， 
就 是 使 用 ALTER TABLE (第 5 章 讲 过 )， 如 下 : 


ALTER TABLE bird_orders 
AUTO_INCREMENT = 100; 


这 个 命令 虽说 是 更 改 bird_orders 表 , 但 实际 修改 的 是 服务 器 上 保存 AUTO_INCREMENT 值 的 
表 。 这 会 使 得 我 们 输入 的 第 一 个 鸟 目的 order_id 为 100。 

接 下 来 输入 乌 目 数据 。 我 们 可 以 用 插入 多 行 的 语法 来 快速 录入 大 批 数 据 。 因 为 现代 乌 目 也 
只 有 29 种 ， 所 以 我 们 可 以 一 次 就 输入 所 有 数据 。 下 面 这 段 长 长 的 SQL 语句 就 是 我 用 来 输 
数据 的 。 你 可 以 从 我 的 网 站 下 载 这 个 表 ， 又 或 者 将 以 下 SQL 语句 复制 粘贴 到 mysqt 中 : 
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INSERT INTO bird_orders (scientific name, brief_description) 
VALUES( 'Anseriformes', "Waterfowl"), 
('Galliformes', "Fowl"), 
('Charadriiformes', "Gulls, Button Quails, Plovers"), 
('Gaviiformes', "Loons"), 
('Podicipediformes', "Grebes"), 
('Procellariiformes', "Albatrosses, Petrels"), 
('Sphenisciformes', "Penguins"), 
('Pelecaniformes', "Pelicans"), 
('Phaethontiformes', "Tropicbirds"), 
('Ciconiiformes', "Storks"), 
('Cathartiformes', "New-World Vultures"), 


('Phoenicopteriformes', 


"Flamingos"), 


('Falconiformes', "Falcons, Eagles, Hawks"), 
('Gruiformes', "Cranes"), 
('Pteroclidiformes', "Sandgrouse"), 
('Columbiformes', "Doves and Pigeons"), 
('Psittaciformes', "Parrots"), 
('Cuculiformes', "Cuckoos and Turacos"), 
('Opisthocomiformes' , "Hoatzin"), 


('Strigiformes', "Owls" 


)， 


('Struthioniformes', "Ostriches, Emus, Kiwis"), 
('Tinamiformes', "Tinamous"), 
('Caprimulgiformes', "Nightjars"), 
('Apodiformes', "Swifts and Hummingbirds"), 
('Coraciiformes', "Kingfishers"), 
('Piciformes', "Woodpeckers"), 
('Trogoniformes', "Trogons"), 

('Coliiformes', "Mousebirds"), 
('Passeriformes', "Passerines"); 


在 这 么 大 段 的 SQL 语句 中 ,我 只 为 每 行 指定 了 两 列 的 值 。order_id 是 不 需要 指定 的 ， 因 
为 我 知道 服务 器 会 按 我 之 前 的 要 求 ， 从 100 开始 递增 赋值 。 而 order_image 则 会 获得 默认 


值 NULL， 我 们 可 以 在 以 后 想 添加 























图 像 时 再 填写 。 另 外 ， 我 们 不 能 忽视 已 经 指定 的 列 。 如 


果 你 的 INSERT 语句 中 没有 为 所 有 指定 的 列 给 出 数据 ， 那 么 MySQL 将 会 拒绝 执行 它 ， 并 给 





你 返回 一 个 类 似 下 面 的 报错 信息 : 


ERROR 1136 (21S01) : 











Column count doesn't match vaLue Count at row 1 
这 意味 着 我 们 提供 的 值 的 数量 与 列 的 数量 不 匹配 。 


现在 ， 你 应 该 能 看 出 为 什么 我 要 专门 建 个 表 来 记录 鸟 目 数据 ， 而 不 是 在 鸟 种 表 里 为 每 种 久 
都 孙 和 这些 岛 目 信息 了 吧 。 这 是 因为 有 了 bird_orders 表 ， 你 就 可 以 在 bird_families 表 里 
只 填写 order_id。 这 就 是 参考 表 的 好 处 之 一 。 填 写 数字 比 填写 学 名 简单 ， 而 且 也 降低 了 打 








错字 的 概率 。 


6.2.2 ” 乌 科 表 


既然 bird_orders 表 已 经 有 数据 了 
语句 : 














， 那 么 就 该 轮 到 bird_families 表 了 。 首 先 ， 执 行 以 下 








DESCRIBE bird_families; 


它 将 显示 bird_families 的 表 结 构 。 我 们 还 需要 知道 鸟 科 所 属 乌 目的 order_ id。 现在 ， 先 
从 Gaviidae 这 个 鸟 科 开 始 ， 它 包括 了 Great Northern Loon 这 个 鸟 种 一 一 此 种 已 在 birds 表 
里 了 。 而 它 本 身 又 属于 Gaviiformes 目 。 所 以 ， 我 们 先 用 以 下 SQL 语句 来 查 出 该 鸟 目的 


order_id. 





SELECT order_id FROM bird_orders 
WHERE scientific name = 'Gaviiformes'; 


+---------- + 
| order_id | 
+---------- 十 
| 103 | 
+---------- + 





接着 ， 就 可 以 这 样 把 Gaviidae 录入 bird_families 了 : 


INSERT INTO bird_families 

VALUES(100, 'Gaviidae', 

"Loons or divers are aquatic birds found mainly in the Northern Hemisphere.", 
103); 


此 语句 把 Gaviidae 的 名 字 和 描述 输 进 了 bird_families。 你 可 能 已 经 发 现 ， 尽 管 我 们 为 
family_id 设置 了 自动 递增 ， 但 我 却 在 这 里 指定 了 100。 这 不 是 必要 的 ， 只 是 因为 我 喜欢 标 
识 号 大 于 一 位 。 如 果 loons 这 样 优雅 而 又 古老 的 岛 科 被 编号 为 1， 我 会 感觉 不 太 好 的 。 另 
外 ， 因 为 指定 了 100， 这 也 使 得 服务 器 会 为 下 一 个 鸟 科 带 出 101 的 标识 号 。 


如 果 我 们 提供 的 值 的 数量 对 了 ， 但 顺序 不 合 服 务 器 的 要 求 ， 那 么 服务 器 是 不 一 定 会 接受 
的 。 假 设 我 们 想 再 给 这 个 表 增 加 一 行 一 一 birds 表 中 Wood Duck 所 属 的 Anatidae 科 。 而 在 
写 SQL 语句 时 ， 我 们 给 出 的 值 的 顺序 与 表 结构 的 不 同 。 这 时 ， 服 务 器 还 是 会 尽 可 能 地 执行 
它 ， 只 是 结果 不 如 我 们 所 想 。 例 如 以 下 命令 : 

INSERT INTO bird_families 


VALUES('Anatidae', "This family includes ducks, geese and swans.", NULL, 103); 
Query OK, 1 row affected, 1 warning (0.05 sec) 


注意 此 语句 中 我 们 把 科 的 名 字 放 在 了 第 一 位 ， 然 后 是 描述 ， 再 接着 是 fanily_id NULL， 最 
后 是 order_id 103。 但 MySQL 想 要 的 第 一 列 是 数字 ， 或 DEFAULT， 或 NULL， 而 我 们 却 给 
了 它 文本 。 所 以 ，mysql 的 返回 信息 说 Query 0K, 1 row affected, 1 warning (0.05 sec)， 
意思 是 插入 了 一 行 ， 同 时 也 产生 了 一 条 警告 ， 只 不 过 这 个 警告 没 显 示 出 来 。 于 是 ， 我 们 用 
SHOW NARNING 来 查看 它 警 告 什 么 : 







































































SHOWN WARNINGS \G 


类 火炎 淡 火 淡淡 火 炎炎 火炎 类 火炎 火炎 火炎 火炎 类 火炎 火炎 类 1. row 类 淡淡 淡 火 淡淡 火炎 类 火炎 淡淡 火 尖 类 火炎 火 火 大火 火炎 类 类 
Level: Warning 
Code: 1366 
Message: Incorrect integer value: 'Anatidae' for column 'family id' at row 1 
1 row in set (0.15 sec) 
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这 样 我 们 就 看 到 该 警告 了 ，famtly_id 列 需要 的 是 整数 值 ， 但 得 到 的 却 是 文本 。 那 我 们 就 
用 以 下 SQL 语句 来 看 看 btrd_fantttes 中 录入 数据 后 是 什么 样子 : 


SELECT * FROM bird_families \G 





类 淡淡 淡 火 火炎 火炎 类 火炎 淡淡 火 尖 类 火炎 淡 火 大火 火炎 类 类 yh row 类 淡淡 火炎 火 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 类 火炎 类 
family_id: 100 
scientific_name: Gaviidae 
brief_description: Loons or divers are aquatic birds 
found mainly in the Northern Hemisphere. 
order_id: 103 


类 淡淡 淡 火 火炎 火炎 类 火 炎炎 火炎 类 类 火炎 火 火 炎炎 火炎 类 类 ” row 类 淡淡 火 淡淡 火炎 淡 火 炎炎 火炎 类 火炎 火炎 火炎 火炎 类 火炎 类 
family_id: 101 
scientific name: This family includes ducks, geese and swans. 
brief_description: NULL 
order_id: 103 


第 一 行 是 对 的 ， 那 是 我 们 之 前 用 正确 的 方法 输入 的 。 但 第 二 行 ， 因 为 MySQL 没有 获得 像 
样 的 值 ， 所 以 它 就 忽略 了 我 们 指定 的 值 ， 而 给 该 列 赋 了 101 一 一 这 是 根据 AUTO_INCREMENT 
而 得 的 。 然 后 ， 它 把 我 们 想 要 赋予 brief_description 列 的 描述 放 到 了 scientific_name 
列 ， 把 想 要 赋予 family_id 的 NULL 放 到 了 brief_description。 这 样 的 结果 是 需要 修改 或 
删除 的 。 我 们 就 删 掉 它 吧 ， 用 DELETE: 


DELETE FROM bird_ families 
WHERE family_id = 101; 


这 只 会 删 掉 一 行 ，family_id 为 101 的 那 行 。 用 DELETE 时 要 小 心 。 我 们 没有 UNDO 命令 。 如 
果 你 没 加 上 WHERE 子 句 ， 那 就 会 删 掉 整个 表 的 数据 。 对 于 这 个 只 有 两 行 数据 的 表 来 说 ， 重 
新 输入 数据 也 不 是 什么 问题 。 但 如 果 是 有 数 千 行 数据 ， 而 又 没 做 备份 ， 那 么 就 可 能 永远 
都 找 不 回来 了 。 即 使 你 有 备份 ， 恢 复数 据 也 不 是 能 瞬间 轻松 做 到 的 。 所 以 ， 要 小 心 使 用 
DELETE 语句 ， 并 且 永 远 都 加 上 WHERE 子 句 来 限定 要 删除 的 部 分 。 


现在 我 们 来 重新 输入 Anatidae， 但 这 次 换 一 种 语法 ， 让 我 们 不 用 为 所 有 列 都 指明 值 ， 也 不 
用 按 表 结构 的 顺序 来 列 出 这 些 值 : 
INSERT INTO bird families 


(scientific name, order_id, brief_description) 
VALUES( 'Anatidae', 103, "This family includes ducks, geese and swans."); 


为 了 达到 这 个 目的 ， 我 们 在 设置 值 之 前 ， 先 用 括号 来 指定 要 输入 到 哪些 列 中 。 如 果 所 给 的 
值 能 按 顺序 对 上 所 有 列 ， 那 么 是 没 必要 指定 列 的 。 但 我 们 现在 这 条 SQL 语句 不 是 这 样 ， 我 
们 必须 说 明 想 要 插入 哪些 列 中 ， 这 些 列 怎样 与 VALUES 子 句 里 的 值 一 一 对 应 。 简 单 来 说 ， 就 
是 告诉 服务 器 这 些 值 代表 什么 ， 让 服务 器 能 把 这 些 值 放 到 对 应 的 列 里 。 而 那些 我 们 没 给 值 
的 列 ， 或 没 指定 的 列 ， 服 务 器 会 给 默认 值 。 现 在 来 看 看 插入 的 结果 : 


SELECT * FROM bird_families \G 























































































































光 兴 兴 光 火光 炎炎 火光 炎炎 光 炎 炎炎 天 炎炎 类 炎 火光 火炎 火光 1. row 类 淡淡 火炎 火 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 炎炎 炎炎 
family_id: 100 
scientific_name: Gaviidae 
brief_description: Loons or divers are aquatic birds 
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found mainly in the Northern Hemisphere. 
order _ id: 103 


类 火炎 淡 火 淡淡 火 火炎 火炎 类 火炎 火炎 火炎 火炎 淡 火 火炎 火炎 有 row 类 淡淡 火 火 淡淡 火炎 类 火炎 火 火 火 尖 炎炎 类 淡 火 类 火炎 类 类 类 
family_id: 102 
scientific name: Anatidae 
brief_ description: This family includes ducks, geese and swans. 
order_id: 103 


这 就 好 多 了 。 注 意 这 次 服务 器 按 指令 将 科 名 Antaidae 放 到 了 scientific_name 中 。 同 时 ， 
它 还 给 fanily_id 赋予 了 一 个 数字 值 。 因 为 此 前 设置 过 了 101 (虽然 后 来 被 删 掉 ) ， 所 以 这 
样 加 1 后， 就 把 这 行 的 标识 号 设 为 了 102。 你 可 以 更 改 此 行 的 标识 号 并 重 置 计数 器 ( 即 此 
表 的 family_id 的 AUTO_INCREAMENT 的 值 ) ， 不 过 其 实 也 并 不 重要 。 

现在 开始 准备 插入 鸟 科 的 数据 。 这 次 我 们 简单 一 点 ， 只 录入 学 名 和 鸟 目标 识 号 。 首 先 ， 用 
以 下 SQL 语句 来 查询 各 个 鸟 目的 标识 号 : 


SELECT order_iLd，sctentiLfic_name FROM bird_orders; 




















+---------- +--------------------- + 
| order id | scientific name | 
+---------- +--------------------- + 
| 100 | Anseriformes 

| 101 | Galliformes 

| 102 | Charadriiformes | 
| 103 | Gaviiformes 

| 104 | Podicipediformes | 
| 105 | Procellariiformes | 
| 106 | Sphenisciformes | 
| 107 | Pelecaniformes | 
| 108 | Phaethontiformes | 
| 109 | Ciconiiformes | 
| 110 | Cathartiformes | 
| 111 | Phoenicopteriformes | 
| 112 | Falconiformes | 
| 113 | Gruiformes | 
| 114 | Pteroclidiformes | 
| 115 | Columbiformes | 
| 116 | Psittaciformes | 
| 117 | Cuculiformes 

| 118 | Opisthocomiformes | 
| 119 | Strigiformes 

| 120 | Struthioniformes | 
| 121 | Tinamiformes 

| 122 | Caprimulgiformes | 
| 123 | Apodiformes 

| 124 | Coraciiformes | 
| 125 | Piciformes | 
| 126 | Trogoniformes | 
| 127 | Coliiformes 

| 128 | Passeriformes | 
+---------- +--------------------- + 





接着 ， 使 用 一 个 巨大 的 INSERT 语句 来 插入 数据 到 bird_families。 其 中 每 个 科 的 数据 都 要 
用 括号 括 起 来 ， 每 对 括号 之 间 用 和 喜 号 分 隔 。 查 询 过 观 鸟 指南 后 ， 我 们 知道 了 各 科 所 属 的 
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目 ， 并 写 出 了 如 下 的 SQL 语句 : 


INSERT INTO bird_families 

(scientific name, order_id) 

VALUES( 'Charadriidae' , 109), 
('Laridae', 102), 
('Sternidae', 102), 
('Caprimulgidae' , 122), 
('Sittidae', 128), 
('Picidae', 125), 
('Accipitridae', 112), 
('Tyrannidae' , 128), 
('Formicariidae' , 128), 
('Laniidae', 128); 


此 语句 一 次 插入 了 十 行 数据 。 注 意 我 们 不 需要 为 每 一 行 都 指定 列 名 。 还 有 ， 我 们 这 次 没有 
提 到 family_id。 这 样 ， 服 务 器 就 会 自动 取 该 域 的 序列 号 的 下 一 个 值 来 填 入 其 中 。 另 外 ， 
我 们 也 没有 写 brief_description 列 。 这 列 会 在 以 后 我 们 想 输入 的 时 候 再 输入 。 


如 果 你 希望 这 个 表 更 大 ， 并 带 有 各 科 的 描述 ， 那 么 可 以 从 我 的 网 站 上 下 载 。 暂 时 来 说 ， 这 
十 行 是 足够 的 。 现 在 执行 一 个 SELECT 语句 ， 来 看 看 有 些 什 么 family_id。 我 们 将 会 在 录入 
birds 表 时 用 到 它们 。 

SELECT family_id, scientific_name 


FROM bird_families 
ORDER BY scientific_nanme; 






































+----------- +----------------- 十 
| family_id | scientific name | 
+----------- +----------------- 十 
| 109 | Accipitridae | 
| 102 | Anatidae | 
| 106 | Caprimulgidae | 
| 103 | Charadriidae | 
| 111 | Formicariidae | 
| 100 | Gaviidae | 
| 112 | Laniidae | 
| 104 | Laridae | 
| 108 | Picidae | 
| 107 | Sittidae | 
| 105 | Sternidae | 
| 110 | Tyrannidae | 
+----------- +----------------- 十 


这 里 我 还 增加 了 一 个 ORDER BY 子 句 ， 以 确保 结果 是 按照 学 名 的 字母 序 来 显示 的 。 关 于 
ORDER BY， 我 会 在 第 7 章 详细 介绍 。 

现在 可 以 输入 数据 到 birds 表 了 。 该 表 已 有 一 个 属于 Charadriidae 科 的 岸 鸟 Killdeer。 所 
以 ， 我 们 给 它 增加 几 个 同 科 的 鸟 。 从 上 面 的 结果 可 看 出 ，Killdeer 所 属 的 Charadriidae 的 标 
识 号 是 103。 不 过 ， 在 你 的 机 器 上 看 到 的 可 能 和 在 我 的 机 器 上 的 不 一 样 。 


得 知 岸 鸟 的 family_id 以 后 ， 再 看 看 birds 表 中 我 们 要 填 哪 些 列 。 先 用 SHOW COLUNMNS : 
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SHOW COLUMNS FROM birds; 


+------------------------ +-------------- +------ +----- +------- +---------------- 十 
| Field | Type | Null | Key |Default| Extra | 
+------------------------ +-------------- +------ +----- +------- +---------------- + 
| bird_id | int(11) | NO | PRI | NULL | auto_increment | 
| scientific name | varchar(100) | YES | UNI | NULL | | 
| common_name | varchar(255) | YES | | NULL | 

| family_id | int(11) | YES | | NULL | | 
| conservation status_ id | int(11) | YES | | NULL | 

| wing_id | char(2) | YES | | NULL | | 
| body_id | char(2) | YES | | NULL | | 
| bill_id | char(2) | YES | | NULL | | 
| description | text | YES | | NULL | 

+------------------------ +-------------- +------ +----- +------- +---------------- + 




















结果 跟 DESCRIBE 没什么 两 样 。 不 过 ，SHOW COLUMNS 语句 可 基于 茶 些 模式 来 过 站 结 果 。 例 
如 ， 假 设 你 只 想 查 询 用 于 参考 的 列 一 一 以 -id 结尾 的 列 ， 那 么 你 可 以 这 么 做 : 


SHOW COLUMNS FROM birds LIKE '%id'; 





+------------------------ +--------- +------ +----- +--------- +---------------- + 
| Field | Type | Null | Key | Default | Extra 
+------------------------ +--------- +------ +----- +--------- +---------------- + 
| bird_id | int(11) | NO | PRI | NULL | auto_increment | 
| family_id | int(11) | YES | | NULL | 

| conservation status id | int(11) | YES | | NULL | | 
| wing_id | char(2) | YES | | NULL | 

| body_id | char(2) | YES | | NULL | 

| bill_id | char(2) | YES | | NULL | 
+------------------------ +--------- +------ +----- +--------- +---------------- + 





我 们 使 用 了 百 分 号 (%) 作为 通配符 这 里 不 是 用 星 号 的 以 指定 开头 为 任意 字符 ， 
结尾 为 .id 的 这 种 模式 。 对 于 有 大 量 列 的 表 ， 这 种 过 滤 是 挺 有 用 的 。 所 以 ， 在 起 名 字 时 ， 

最 好 制定 一 个 能 方便 日 后 查找 的 命名 规范 (例如 ，%_id)。 下 ， 如 果 你 在 SHOW 
COLUMNS 中 加 上 FULL 标识 (如 SHOW FULL COLUMNS FROM birds;)， 那 么 就 会 看 到 各 列 更 详 
细 的 情况 。 请 在 自己 的 系统 上 试 试 。 


6.2.3 乌 种 表 


FULL 是 挺 好 玩 的 ， 不 过 还 是 回 到 本 章 的 重点 一 一 插入 数据 。 回 顾 了 birds 表 的 结构 以 后 
现在 就 输入 一 些 岸 鸟 的 数据 吧 。 在 mysql 中 执行 以 下 命令 : 
INSERT INTO birds 


(common_name, scientific name, family_id) 
VALUES( 'Mountain Plover', 'Charadrius montanus', 103); 


这 就 添加 了 一 个 Mountain Plover。 注 意 ， 我 打 乱 了 列 的 顺序 ， 但 执行 起 来 没有 问题 ， 因 
为 后 面值 的 顺序 与 这 些 列 相符 。 这 种 乌 的 fanily_id 是 103， 以 示 它 属于 Charadriidae 科 。 
这 一 行 还 有 一 些 列 没 填 数据 ， 那 些 我 们 以 后 再 弄 。 现 在 用 INSERT 的 多 行 语法 ， 再 输入 一 
些 岸 乌 : 
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INSERT INTO birds 
(Common_name，scientific_name，famtLy_ id) 

VALUES( 'Snowy Plover', 'Charadrius alexandrinus', 103), 
('Black-bellied Plover', 'Pluvialis squatarola', 103), 
('Pacific Golden Plover', 'Pluvialis fulva', 103); 


此 例 中 ， 我 们 用 一 条 语句 插入 了 三 个 fanily_id 相同 的 鸟 种 。 这 种 做 法 我 们 之 前 在 输入 鸟 
科 和 鸟 目 时 用 过 。 注 意 这 里 用 于 family_id 的 数字 没有 引号 包围 。 那 是 因为 此 列 是 整数 类 
型 的 ， 即 INT， 所 以 直接 填 数 字 是 可 以 的 。 如 果 它 们 是 带 引 号 的 ， 那 么 MySQL 一 开始 会 
把 它们 当成 字符 ， 但 经 过 分 析 ， 又 会 发 现 它 们 是 数字 ， 并 将 它们 当 数 字 存储 。 有 具体 就 是 这 
样 。 或 者 简单 来 说 ， 填 数字 列 ， 带 不 带 括号 是 没什么 所 谓 的 。 
有 了 更 多 乌 的 数据 之 后 ， 我 们 就 来 把 这 些 表 连接 起 来 查询 数据 吧 。 我 们 需要 使 用 SELECT 
语句 ， 并 指定 一 系列 的 表 以 合并 出 结果 。 这 上 比 之 前 我 们 写 过 的 任何 一 个 SELECT 都 要 复 
杂 ， 它 能 让 你 看 到 各 个 不 同 的 表 的 用 途 ， 万 其 是 那些 参考 表 。 试 着 在 你 的 机 器 上 输入 以 下 
SQL 语句: 
SELECT common_name AS 'Bird '， 
birds.scientific name AS 'Scientific Name ' ， 
bird_families.scientific name AS 'Family', 
bird_orders.scientific_ name AS 'Order' 
FROM birds, 
bird_families, 
bird_orders 


WHERE birds.family_id = bird_families.family_id 
AND bird_families.order_id = bird_orders.order_id; 


















































| Mountain Plover | Charadrius montanus | Charadriidae | Ciconiiformes 
| Snowy Plover | Charadrius alex... | Charadriidae | Ciconiiformes 
| Black-bellied Plover | Pluvialis squatarola | Charadriidae | Ciconiiformes 
| Pacific Golden Plover | Pluvialis fulva | Charadriidae | Ciconiiformes 





我 在 此 SELECT 语句 中 连接 了 三 个 表 。 在 看 它 查 询 哪些 列 之 前 ， 先 来 看 看 FROM 子 句 里 面 有 
什么 。 注 意 其 中 我 指明 了 三 个 表 ， 并 用 逗号 将 它们 分 隔 开 来 。 为 了 让 你 看 得 明白 ， 我 还 做 
了 一 些 缩 进 。 当 然 ， 表 名 是 不 一 定 要 分 行 来 写 的 。 


MySQL 根据 WHERE 子 句 的 内 容 来 把 这 三 个 表 串 起 来 。 首 先 ， 我 们 告诉 MySQL， 把 btrds 
表 与 bird_families 表 中 family_id 相同 的 记录 连接 起 来 。 然 后 ， 再 用 一 个 AND， 以 指示 后 
面 还 有 其 他 条 件 。 那 就 是 把 btrd_famitLies 表 与 bird_orders 表 中 order_id 相同 的 记录 连 
这 看 起 来 挺 复杂 的 。 但 如 果 你 的 手头 上 有 一 张 包含 数 千 种 鸟 的 表格 ， 以 及 一 张 鸟 科 表格 和 
一 张 鸟 目 表格 ， 并 想 用 它们 来 列 出 每 种 鸟 的 名 字 、 所 属 的 科 和 目 ， 那 么 应 该 也 会 做 如 同上 
例 的 事情 一 一 找 出 一 张 表 中 每 一 行 的 关键 字 ， 然 后 在 其 他 表 中 以 此 关键 字 找 出 对 应 的 行 。 
这 样 想 的 话 ， 就 很 直观 了 。 




































































接着 看 看 所 查询 的 列 。 我 们 获取 了 来 自 birds 表 的 common_name 和 scientific_name， 并 且 
跟 表 名 一 样 ， 我 把 列 名 也 分 行 了 ， 以 方便 查看 。 另 外 ， 因 为 三 个 表 都 有 叫 作 scientific_ 
nane 的 列 ， 所 以 我 们 必须 在 列 名 前 加 上 表 名 以 作 区 分 。 同 时 ， 我 还 用 As 子 句 来 给 这 些 列 
起 了 别名 ， 使 结果 的 表 头 好 看 一 点 。AS 子 句 对 服务 器 上 的 表 没 有 任何 影响 ， 它 只 会 作用 于 
输出 的 结果 。 所 以 你 可 用 它 来 任意 指定 结果 中 每 列 的 标题 。 


现在 来 研究 一 下 所 得 出 的 结果 。 每 个 科 和 目的 学 名 都 只 需 输入 一 次 ， 然 后 MySQL 就 可 以 
根据 family_id 和 order_id 把 它们 与 多 种 岛 牵扯 在 一 起 。 这 实在 是 很 酷 、 很 省 事 。 
如 之 前 所 说 ， 这 个 SQL 语句 比 以 往 的 都 要 复杂 。 不 过 你 也 不 用 太 担 心 。 我 们 会 在 第 7 章 讲 
解 这 种 SQL 语句 。 现 在 你 只 需 明 白 我 们 这 样 做 的 目的 是 什么 。 这 样 把 拆 分 的 表 连 接 起 来 查 
询 ， 大 大 优 于 建立 一 个 含有 所 有 列 的 大 表 。 对 于 每 一 种 岸 鸟 ， 我 们 只 需 在 family_id 输入 
103， 而 不 用 输入 其 所 属 科目 的 学 名 。 这 使 得 我 们 无 需 担 心 打 错字 ， 节 约 了 时 间 ， 并 有 效 
利用 了 数据 。 


6.3 ”其 他 选择 


本 章 之 前 提 到 过 好 几 次 ，INSERT 语句 还 有 别 的 写法 。 那 么 在 本 节 中 ， 我 就 来 讲 讲 它们 。 刚 
开始 可 能 你 不 会 用 到 这 些 东 西 ， 但 知道 它们 还 是 有 必要 的 。 


6.3.1 明确 插入 


INSERT 除了 有 基本 的 写法 外 ， 还 有 一 种 明确 将 值 与 列 对 应 的 写法 。 如 下 输入 鸟 科 的 例子 。 
试 试 在 mysql 中 输入 ， 看 喜 不 喜欢 : 
INSERT INTO bird_families 


SET scientific name = 'Rallidae', 
order_id = 113; 


它 看 起 来 有 点 奇怪 。 不 过 这 种 写法 更 能 保证 你 不 会 输 错 ， 或 至 少 能 避免 你 搞 乱 列 和 值 的 顺 
序 。 因 为 它 很 死板 ， 所 以 大 多 数 人 都 不 用 它 。 但 它 所 提供 的 准确 性 很 适合 于 自动 化 脚本 。 
因为 它 要 求 在 值 之 前 必须 有 列 名 ， 就 像 其 他 很 多 编程 语言 中 都 有 的 键 值 格 式 。 这 就 方便 了 
人 们 给 脚本 排 错 。 另 外 ， 如 有 果 脚 本 写 好 后 ， 列 有 改名 或 被 删 掉 ， 那 么 该 语句 就 会 被 服务 器 
拒绝 ， 数 据 不 会 被 录入 。 不 过 ， 如 果 你 用 标准 语法 时 写 明 列 名 了 ， 那 么 其 实 也 与 此 没什么 
区 别 。 还 有 ， 这 种 语法 每 次 只 能 插入 一 行 数据 。 


6.3.2 ”插入 其 他 表 中 的 数据 


INSERT 可 与 SELECT 结合 使 用 (第 5 章 简单 介绍 过 )。 现 在 看 看 这 有 什么 用 。 不 过 在 此 之 前 ， 
我 得 先 告 诉 你 ， 本 小 节 的 示例 有 点 复杂 。 你 不 一 定 要 执行 下 面 的 示例 ， 仅 仅 看 看 就 好 。 


早 前 我 们 输入 过 13 个 鸟 科 。 你 可 以 通过 下 载 我 的 网 站 上 的 鸟 科 表 来 录入 所 有 鸟 科 ， 而 我 
录入 那个 鸟 科 表 时 ， 其 实 是 用 的 其 他 地 方 的 数据 (我 总 不 能 手工 输入 228 行 吧 )。 当 时 我 
去 了 康 奈 尔 大 学 的 网 站 。 那 里 有 个 教授 鸟 类 学 的 鸟 类 实验 室 ， 它 是 此 学 科 的 权威 。 在 其 网 
页 上 ， 有 个 公开 的 数据 表 。 于 是 我 将 该 表 导 入 我 的 服务 器 上 的 rookery 数据 库 ， 并 将 其 命 
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名 为 cornell_birds_families_orders。 以 下 是 该 表 的 结构 ， 以 及 其 中 数据 的 样子 。 


DESCRIBE cornell_birds_families_orders; 








+------------- +-------------- +------ +----- +--------- +---------------- 十 
| Field | Type | Null | Key | Default | Extra | 
+------------- +-------------- +------ +----- +--------- +---------------- 十 
| fid | int(11) | NO | PRI | NULL | auto_increment | 
| bird_family | varchar(255) | YES | | NULL | | 
| examples | varchar(255) | YES | | NULL | | 
| bird_order | varchar(255) | YES | | NULL | | 
+------------- +-------------- +------ +----- +--------- +---------------- 十 
SELECT * FROM cornell_birds_ families orders 

LIMIT 1; 

+----- +--------------- +---------- +------------------ 十 

| fid | bird_ family | examples | bird_order | 

+----- +--------------- +---------- +------------------ 十 

| 1 | Struthionidae | Ostrich | Struthioniformes | 

+----- +--------------- +---------- +------------------ 十 


这 些 数 据 可 以 利用 。 我 可 以 直接 取 科 的 名 字 ， 然 后 拿 examples 来 作为 描述 ， 填 充 到 bird_ 
families 表 中 。 我 不 需要 它们 的 标识 号 〈 即 fid) ， 因 为 我 要 用 自己 的 。 另 外 我 还 需要 一 种 
能 将 此 表 中 的 btrd_order 列 与 我 们 bird_orders 表 的 scientific_name 列 匹 配 的 方法 ， 以 
便 找 出 正确 的 order_id 填 到 bird_families 表 中 。 


可 选 的 方法 有 很 多 。 其 中 一 种 是 ， 先 增加 一 个 列 ， 以 保存 来 自 康 奈 尔 的 btrd_order。 这 要 
用 到 第 5 章 介绍 的 ALTER TABLE 语句 ， 如 下 : 


ALTER TABLE bird families 
ADD COLUMN cornell_bird_order VARCHAR(255); 


加 完 以 后 ， 就 可 以 用 以 下 SQL 语句 ， 把 cornell_birds_families_orders 的 数据 复制 到 我 
们 的 鸟 科 表 了 : 

INSERT IGNORE INTO bird families 

(scientific name, brief description, cornell_bird order) 


SELECT bird_family, examples, bird_order 
FROM cornell_birds families orders; 


仔细 看 一 下 这 个 命令 ， 其 中 包含 的 知识 你 可 能 以 后 会 用 到 。 它 首先 如 常 地 以 INSERT 开头 ， 
接着 ， 在 本 应 使 用 VALUES 的 地 方 ， 我 却 放置 了 一 个 完整 的 SELECT 语句 。 这 个 SELECT 的 写 
法 与 我 们 之 前 所 见 的 没有 差别 。 它 看 上 去 很 普通 ， 但 实际 上 很 灵活 而 且 很 强大 。 


从 概念 上 来 说 ， 你 可 以 把 它 想象 成 ， 这 个 人 艇 入 INSERT 语句 的 SELECT 产生 了 多 行 数据 ， 每 
行 的 值 的 顺序 就 如 在 SELECT 中 你 指明 的 列 的 顺序 一 样 。 这 些 值 跟 VALUES 子 句 类 似 ， 把 

给 出 的 值 送 到 父 语句 INSERT， 然 后 按 顺序 与 列 对 应 起 来 ， 填 入 其 中 。 

此 INSERT 的 开头 有 点 不 同 ， 那 就 是 增加 了 一 个 IGNORE 选项 。 这 是 因为 bird_families 表 已 
经 存 了 一 些 数据 ， 而 scientific_name 列 设置 为 了 UNIQUE， 不 允许 出 现 重复 的 学 名 。 所 以 ， 

如 果 这 个 多 行 插入 因为 产生 了 重复 列 名 而 出 错 ， 那 么 整个 语句 都 会 失败 ， 并 返回 一 个 错误 
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信息 。 而 IGNORE 标志 则 指示 服务 器 忽略 所 有 错误 ， 并 插入 那些 没有 产生 错误 的 行 。 这 就 避 
免 了 失败 和 报错 ， 你 可 以 以 后 再 查看 那些 另存 起 来 的 警告 信息 。 这 意味 着 ， 当 服务 器 执行 
完 这 语句 时 ， 如 果 你 想 看 报错 的 话 ， 可 以 使 用 SHOW WARNINGS 语句 ， 来 看 看 哪些 行 没 有 插 
入 。 这 对 于 想 要 忽略 重复 而 只 处 理 非 重复 数据 的 人 来 说 很 有 用 。 
既然 录 完 数据 了 ， 那 就 在 mysql 中 用 以 下 SQL 语句 ， 来 查询 该 表 的 最 后 一 行 一 一 只 显示 
行 就 够 了 。 

SELECT * FROM bird_families 

ORDER BY family_id DESC LIMIT 1; 











4 


+----------- +----------------- +----------------- +---------- +------------------- + 
| family_id | scientific name |brief description| order_ id | cornell_bird_order| 
+----------- +----------------- +----------------- +---------- +------------------- 十 
| 330 | Viduidae | Indigobirds | NULL | Passeriformes 

+----------- +----------------- +----------------- +---------- +------------------- 十 

















这 个 SELECT 语句 是 带 有 ORDER BY 子 句 的 ， 它 使 得 查询 结果 按 family_id 来 排序 。 而 其 后 
的 DESC， 意 思 是 逆序 。LIMIT 子 句 则 告诉 MySQL 只 显示 一 行 。 从 返回 的 结果 可 以 看 出 ， 
INSERT INT0. . .SELECT 运作 正常 。 


6.3.3 题 外 话 : 设置 正确 的 order_id 


上 例 的 INSERT 使 得 我 们 从 一 个 免费 的 数据 库 中 获取 到 了 所 需 的 数据 ， 并 填 入 了 我 们 自己 
的 表 中 ， 但 里 面 还 差 了 一 些 数据 : 每 个 科 所 属 的 目的 标识 号 。 我 们 的 目 是 定义 在 bird_ 
orders 表 中 的 ， 每 个 目 都 有 一 个 随意 的 order_ id。 这 些 order_id 与 康 奈 尔 的 是 不 同 的 。 
所 以 我 要 根据 cornell_bird_order 列 的 值 ， 查 出 bird_orders 表 对 应 的 order id， 来 填 到 
bird_families 表 的 order_id 中。 


这 看 上 去 有 些 复杂 ， 不 过 这 个 过 程 也 展示 了 关系 型 数据 库 的 强大 。 简 单 来 说 ， 我 要 用 
bird_orders 表 与 康 奈 尔 的 数据 做 连接 。 之 前 我 们 已 经 从 康 奈 尔 那 里 得 到 了 鸟 目 的 名 字 。 
它们 与 我 们 bird_orders 表 里 的 scientific_name 是 一 致 的 。 但 我 们 不 想 直接 在 bird_ 
families 表 上 标记 鸟 目的 名 字 ， 而 想 用 order_id 来 与 bird_orders 表 关 联 。 


要 做 好 关联 ， 就 需要 用 bird_orders 表 的 order_id 列 来 设置 bird_families 表 中 的 order _ 
id 列 。 要 解决 这 个 问题 ， 得 先 找 出 btrd_orders 表 中 与 corneLL_bird_order 列 对 应 的 行 。 


最 终 我 们 会 用 到 UPDATE 语句 。 不 过 在 此 之 前 ， 先 构造 一 个 SELECT 语句 来 测试 一 下 ， 以 确 
保 我 们 的 鸟 目 名 字 能 跟 康 奈 尔 的 对 得 上 。 


SELECT DISTINCT bird_orders.order_id, 
cornell_bird_order AS "Cornell's Order", 
bird_orders.scientific name AS 'My Order' 

FROM bird_families, bird_orders 

WHERE bird_families.order_id IS NULL 

AND cornell_bird_order = bird_orders.scientific_name 
LIMIT 5; 



































+---------- +------------------ +------------------ 十 
| order_id | Cornell's Order | My Order 
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+---------- +------------------ +------------------ + 
| 120 | Struthioniformes | Struthioniformes | 
| 121 | Tinamiformes | Tinamiformes | 
| 100 | Anseriformes | Anseriformes | 
| 101 | Galliformes | Galliformes | 
| 104 | Podicipediformes | Podicipediformes | 
+---------- +------------------ +------------------ + 


这 里 测试 的 WHERE 子 句 是 我 们 接 下 来 要 在 UPDATE 中 使 用 的 。 在 实际 UPDATE 之 前 ， 最 好 先 
看 看 这 个 WHERE 行 不 行 。 

此 WHERE 含有 两 个 条 件 。 第 一 个 用 于 限制 只 更 新 那些 未 设 order_id 的 行 。 这 是 合理 的 。 如 
果 已 设 好 值 ， 那 没有 理由 再 去 改 它 。 


而 AND 后 就 是 第 二 个 条 件 ， 它 更 重要 。 它 根据 康 奈 尔 的 学 名 找 出 对 应 的 bird_orders 记录 ， 
即 查 出 与 cornell_bird_order 相等 的 bird_orders 表 的 scientific_name 所 在 的 行 。 


如 果 你 想 用 INSERT…SELECT、REPLACE 或 UPDATE 来 更 改 数 据 ， 那 么 可 以 先 按 上 例 来 测试 它 
们 所 带 的 WHERE 子 句 。 如 果 测 试 返回 了 所 需 的 行 ， 并 且 内 容 看 起 来 没什么 问题 ， 那 么 就 可 
以 将 该 WHERE 应 用 到 其 他 更 改 数据 的 命令 中 了 。 


刚才 这 个 SELECT， 与 我 们 之 前 用 于 对 birds、bird_families 和 bird_orders 表 进 行 关联 查 
询 的 SELECT 语句 很 像 。 只 不 过 ， 它 还 增加 了 一 个 DISTINCT 选项 。 这 会 只 查 出 所 有 列 都 不 
同 的 行 。 因 为 Struthioniformes 目 包 含 的 科 超 过 五 个 ， 而 我 又 限制 了 只 输出 五 行 (用 LIMIT 
5) ， 所 以 如 果 不 加 DISTINCT 的 话 ， 就 会 看 到 第 一 行 重复 了 五 次 。 而 加 上 DISTINCT 就 使 得 
这 五 行 都 是 不 同 的 排列 ， 也 使 我 们 更 加 相信 这 个 WHERE 是 正确 的 。 


因为 查询 结果 无 误 ， 所 以 接 下 来 就 可 以 给 bird_families 表 做 UPDATE 了 。UPDATE 语句 是 用 
来 修改 或 更 新 数据 的 。 其 基本 语法 是 ， 指 出 你 要 更 新 的 表 的 名 字 ， 然 后 用 SET 子 句 来 设置 
各 列 的 值 。 它 有 点 像 6.3.1 节 中 的 SELECT 语句 。 你 还 可 以 使 用 WHERE 来 指定 要 更 新 哪些 行 : 
UPDATE bird_families, bird_orders 
SET bird_families.order_id = bird_orders.order_id 


WHERE bird_families.order_id IS NULL 
AND cornell_bird order = bird orders.scientific name; 


以 上 语句 相当 复杂 ， 让 我 们 再 逐步 分 析 一 下 此 UPDATE 语句 干 了 什么 : 它 告 诉 MySQL, 将 
bird_families 表 的 order_id 设置 为 bird_orders 表 中 对 应 行 的 order_id 的 值 一 一 但 因为 
后 面 的 AND 子 句 ， 它 只 会 作用 于 cornell_bird_order 与 bird_orders 表 中 scientific_name 
相等 的 行 。 
我 知道 这 涉及 了 很 多 东西 。 我 会 在 第 8 章 更 详尽 地 介绍 这 条 语句 。 
现在 来 看 看 更 新 的 结果 。 我 们 会 用 之 前 用 过 的 那个 SELECT， 但 这 次 LIMIT 为 4， 以 看 多 
儿 行 : 

SELECT * FROM bird_families 

ORDER BY family_id DESC LIMIT 4; 
































































































































+----------- +----------------- +--------------------- +---------- + 
| family id | scientific name | brief _ description | order id | 
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+----------- +----------------- +--------------------- +---------- 十 
| 330 | Viduidae | Indigobirds | 128 | 
| 329 | Estrildidae | Waxbills and Allies | 128 | 
| 328 | Ploceidae | Weavers and Allies | 128 | 
| 327 | Passeridae | Old World Sparrows | 128 | 
+----------- +----------------- +--------------------- +---------- 十 


这 看 上 去 好 像 成 功 了 。Viduidae 科 的 order_id 列 有 值 


bird_orders， 看 看 这 个 值 正 不 正确 : 


SELECT * FROM bird_orders 
WHERE order_id = 128; 








3 
a 




















+---------- +----------------- +------------------- +------------- 十 
| order id | scientific name | brief description | order_image | 
+---------- +----------------- +------------------- +------------- + 
| 128 | Passeriformes | Passerines | NULL 

+---------- +----------------- +------------------- +------------- + 


再 是 NULL。 那 就 再 检查 一 下 


这 是 正确 的 。128 这 个 order_id 是 Passeriformes， 康 奈 尔 也 说 它 是 Viduidae 科 所 属 的 目 。 


接着 ， 看 看 bird_families 中 哪些 外 


了 是 找 不 到 order_id 的 : 


SELECT family_id, scientific name, brief_description 
FROM bird_families 
WHERE order_id IS NULL; 


he 
| family_id 
ee 


| 
| 
| 
| 
| 
| 
| 
| 148 
| 
| 
| 
| 
| 
| 
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于 这 


四 
| 
+ 
| 
| 
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| 
| 
| 
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| 
| 
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下 
| 
十 
Fregatidae | 
Sulidae 
Phalacrocoracidae | 
Anhingidae | 
Cathartidae | 
Sagittariidae | 
Pandionidae | 
Otididae 
Mesitornithidae | 
Rhynochetidae | 
Eurypygidae | 
Pteroclidae | 
Bucconidae | 
Galbulidae | 
Cariamidae | 
的 





SR + 
brief_description | 
SE a a 本 
Frigatebirds 

Boobies and Gannets | 
Cormorants and Shags | 
Anhingas | 
New World Vultures | 
Secretary-bird | 
Osprey 

Bustards 

Mesites 

Kagu 

Sunbittern 

Sandgrouse 

Puffbirds 

Jacamars 

Seriemas 

a 


因为 某 些 原因 ，bird_orders 表 中 未 能 找到 与 这 15 行 匹配 的 数据 。 那 么 














下 面 来 看 看 我 是 怎么 


我 先 查 了 一 下 Osprey， 发 现 它 有 两 个 可 用 的 目 名 : Accipitriformes 和 Falconiformes。 其 
中 Accipitriformes 是 康 奈 尔 的 叫 法 ， 而 Falconiformes 是 我 的 bird_orders 表 的 叫 法 (在 
order_id 为 112 的 那 行 )。 我 决定 用 112 来 更 新 bird_families 表 





解决 的 。 





我 得 查 杏 为 什么 
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UPDATE bird_families 
SET order_ id = 112 
WHERE cornell_bird order = 'Accipitriformes'; 


我 本 来 可 以 在 WHERE 子 句 中 用 family_id 的 ， 但 我 用 Accipitriformes 一 查 ， 发 现 还 有 另外 
两 个 科 ， 所 以 用 corneLL_bird_order = 'Accipitriformes' 可 以 一 次 更 新 这 三 行 。 再 检查 
一 下 ， 我 还 发 现 有 四 个 鸟 科 属 于 一 个 新 的 叫 Suliformes 的 鸟 目 。 于 是 我 就 在 btrd_orders 
表 中 加 上 了 这 个 Suliformes， 然 后 更 新 了 一 下 那 四 个 科 的 order_id。 在 创建 数据 库 或 从 其 
他 库 导 入 大 量 数据 时 ， 这 种 清理 方法 是 很 常见 的 。 

那么 ， 剩 下 的 清理 工作 就 是 : 删 掉 bird_families 表 中 那个 额外 的 列 ( 即 cornell_bird_ 
order 列 )， 以 及 cornell_birds_families_orders 表 : 





















































ALTER TABLE bird families 
DROP COLUMN cornell_bird_order; 


DROP TABLE cornell_birds families _ orders; 


以 上 这 些 例子 是 有 点 难 ， 所 以 如 果 你 感到 困惑 ， 也 不 要 气 蚀 。 很 快 ， 你 就 能 亲手 构造 出 更 
复杂 的 SQL 语句 了 。 而 且 ， 到 时 你 回 过 头 来 看 ， 会 发 现 其 实 这 些 例子 还 可 以 简化 。 另 外 ， 
我 还 想 告 诉 你 ， 强 大 的 不 止 是 MySQL 和 MariaDB ， 还 有 它们 的 社区 。 之 所 以 提 及 社区 ， 
是 因为 在 那里 ， 你 可 以 找到 一 些 免费 下 载 的 数据 表 ， 以 便 自 己 把 玩 。 这 就 让 你 省 了 很 多 数 
据 库 管理 的 工作 ， 玩 起 来 没 那么 问 。 导 入 大 批 数 据 的 方法 还 有 很 多 ， 其 至 还 可 以 导入 一 些 
不 是 来 自 MySQL 表 的 数据 。 具 体会 在 第 15 章 介绍 。 


6.3.4 ”替换 数据 

当 你 使 用 多 行 语法 来 给 一 个 现存 的 表 插 入 数据 时 ， 如 果 其 中 有 操作 到 声明 为 键 的 列 ， 那 就 
可 能 会 出 现 一 些 问 题 。 如 上 例 中 的 bird_families 表 ， 它 的 scientific_name 是 一 个 UNIQUE 
键 ， 即 每 个 科 的 学 名 只 允许 有 一 条 记录 。 如 果 MySQL 在 执行 INSERT 语句 时 发 现 有 键 重 
复 ， 那 么 它 就 会 拒绝 执行 ， 并 返回 一 个 报错 信息 。 最 后 什么 都 不 会 插入 。 


于 是 你 得 改 改 那个 可 能 很 长 的 INSERT 语句 ， 剔 除 掉 重 复 项 后 ， 再 运行 一 次 。 如 果 重 复 项 和 
多 ， 那 么 就 会 多 次 接收 错误 信息 ， 然 后 多 次 修改 ， 直 至 插入 成 功 。 为 了 避免 这 样 ， 在 上 
的 例子 中 ， 我 们 用 了 IGNORE 选项 。 它 告知 MySQL 忽略 错误 ， 重 复 的 就 不 插入 ， 不 重复 
才 插 入 。 


不 过 很 多 时 候 ， 你 可 能 不 想 略 过 那些 重复 的 行 ， 而 想 在 发 生 重复 时 ， 用 新 的 行 来 奉 换 旧 上 
行 。 比 如 在 上 例 ， 因 为 我 们 有 更 新 更 好 的 信息 ， 所 以 就 使 用 了 UPDATE 来 覆盖 掉 旧 的 那些 。 
对 于 这 种 情况 ， 你 可 以 使 用 REPLACE 语句 ， 而 不 是 INSERT。REPLACE 跟 INSERT 一 样 ， 也 是 
插入 数据 。 但 在 遇 到 键 重复 时 (例如 重复 的 scientific_name)， 它 会 采取 替换 的 做 法 。 这 
很 有 用 ， 而 且 也 不 难 。 现 在 看 看 例子 : 

REPLACE INTO bird_fanmilies 

(scientific name, brief_description, order_id) 

VALUES( 'Viduidae', 'Indigobirds & Whydahs', 128), 


('Estrildidae', 'Waxbills, Weaver Finches, & Allies', 128), 
('Ploceidae', 'Weavers, Malimbe, & Bishops', 128); 
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Query OK, 6 rows affected (0.39 sec) 
Records: 3 Duplicates: 3 Warnings: 0 


注意 它 的 语法 跟 INSERT 一 样 ， 选 项 也 一 样 ， 也 同样 可 以 一 次 插入 多 行 。 不 过 ，IGNORE 选 
项 是 不 需要 的 ， 因 为 重复 的 行 已 被 奉 换 了 。 


事实 上 ，REPLACE 所 做 的 替换 ， 是 先 把 原本 的 整 行 删 除 掉 ， 然 后 再 播 入 新 的 那 行 。 如 果 新 
行 中 有 些 列 没有 值 ， 那 么 就 会 使 用 默认 值 。 它 不 会 保留 原本 行 的 任何 列 。 如 果 有 些 列 是 需 
要 保留 的 ， 那 么 使 用 它 就 要 小 心 了 ， 因 为 你 无 法 在 REPLACE 中 选择 只 更 新 某 些 列 。 要 更 新 
间 定 的 列 ， 请 用 UPDATE。 


以 上 REPLACE 及 其 所 带 的 值 ， 还 有 一 些 值得 注意 的 东西 。 在 结果 中 ， 你 可 以 看 到 一 些 不 寻 
常 的 信息 。 它 说 此 SQL 语句 影响 了 六 行 数 据 : 三 行 新 增 的 和 三 行 重复 的 。 六 行 受 影响 ， 听 
起 来 很 奇怪 。 那 是 因为 原本 有 三 行 跟 新 增 的 三 行 在 scientific_name 上 重复 了 ， 于 是 就 被 
删除 了 。 然 后 新 增 的 三 行 ， 或 者 说 用 于 替换 的 三 行 ， 被 插入 了 。 所 以 总 共 六 行 受 影响 : 删 
了 三 行 ， 又 加 了 三 行 。 


结果 中 没有 任何 警告 信息 ， 这 意味 着 MySQL 认为 一 切 正常 。 现 在 看 看 其 中 一 个 被 修改 的 
科 ，Viduidae: 

































































SELECT * FROM bird_families 
WHERE scientific name = 'Viduidae' \G 


类 火炎 淡 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 炎 火 火炎 火炎 1. row 类 淡淡 淡 火 淡淡 火炎 类 火 炎炎 火炎 类 火炎 类 类 火炎 火炎 类 类 类 
family_id: 331 
scientific name: Viduidae 
brief_ description: Indigobirds & Whydahs 
order_id: 128 


虽然 不 太 明 显 ， 但 确实 所 有 东西 都 换 掉 了 。family_id 是 新 的 。 如 果 你 返回 前 面 ， 会 发 现 
之 前 它 是 330。 因 为 当时 它 是 此 表 的 最 后 一 行 ， 所 以 在 替换 时 ， 所 插入 的 新 行 就 被 赋值 为 
331 了 。 而 brief_description 也 出 现 新 值 了 ， 以 前 它 是 只 有 Indigobirds 的 。 

REPLACE 语句 可 用 于 替换 含有 重复 键 的 整 行 数据 ， 或 新 增 原 表 中 所 没有 的 数据 。 如 果 你 
只 想 替 换 某 些 列 ， 那 用 它 就 有 点 问题 了 ， 因 为 它 是 整 行 替换 的 。 另 外 ， 如 果 上 例 中 的 
scientific_name 不 是 UNIQUE 或 键 ， 那 么 REPLACE 的 结果 就 不 是 替换 了 三 行 ， 而 是 新 增 了 
Ex 


6.3.5 ”数据 插入 的 优先 级 

在 一 台 繁 忙 的 MySQL 或 MariaDB 服务 器 上 ， 可 能 经 常会 发 生 多 人 同时 访问 的 情况 。 于 
是 就 会 有 来 自 不 同 客户 端的 SQL 语句 被 同时 输入 。 这 使 得 服务 器 需要 判断 应 该 让 哪个 先 
执行 。 

更 改 数据 的 语句 (INSERT、UPDATE 和 DELETE)， 会 比 查询 语句 (SELECT) 具有 更 高 的 优先 
级 。 添 加 数据 的 人 应 该 比 读 取 数据 的 人 更 重要 ， 因 为 考虑 到 插入 数据 可 能 占用 较 长 时 间 ， 
在 这 期 间 客 户 端 做 不 了 其 他 事情 。 而 相反 ， 查 询 数据 的 人 一 般 都 愿意 等 待 。 就 像 在 购物 网 
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站 中 ， 下 单 的 用 户 会 比 浏览 产品 的 用 户 ， 具 有 更 高 的 优先 级 。 

当 服 务 器 为 客户 端 执 行 一 个 INSERT 语句 时 ， 它 会 锁 住 相关 的 表 ， 以 排斥 其 他 客户 端的 访 
问 ， 直 到 它 执行 完毕 。 不 过 InnoDB 倒 不 是 这 样 : 它 只 锁 住 行 ， 而 不 是 整个 表 。 对 于 一 个 
有 大 量 并 发 数据 请 求 的 繁忙 的 服务 器 来 说 ， 锁 表 会 导致 其 他 用 户 延迟 ， 尤 其 是 在 有 人 使 用 
多 行 语法 来 插入 大 量 数据 的 时 候 。 

你 可 以 为 每 个 INSERT 另外 设 定 优先 级 ， 而 不 采用 MySQL 的 默认 设置 。 这 样 你 就 可 以 决 
定 哪 些 语句 需要 立即 执行 ， 哪 些 可 以 缓 后 。INSERT 语句 提供 了 优先 级 选项 ， 以 便 你 指定 
这 些 偏好 。 选 项 要 写 在 INSERT 和 INT0 之 间 。 它 们 总 共有 三 种 : LOW_PRIORITY、DELAYED 和 
HIGH_PRIORITY。 下 面 就 来 看 看 每 一 个 是 怎么 回 事 。 


1. 调 低 INSERT 的 优先 级 

先 举 个 LOW_PRIORITY 的 用 例 。 假 设 我 们 刚 从 一 个 观 乌 组 织 获 取 到 了 一 个 含有 数 千 行 观 鸟 景 
点 相关 数据 的 文件 。 它 是 一 个 dump 文件 ， 即 一 个 包含 了 必要 的 数据 导入 语句 的 文本 文件 。 
用 文本 编辑 器 打开 它 ， 可 看 到 里 面 有 一 个 一 次 就 插入 所 有 景点 (bird_sightings) 的 巨型 
INSERT 语句 。 虽 然 实际 上 我 们 没有 建 这 样 的 表 ， 但 你 应 该 可 以 想象 它 的 结构 。 

一 旦 这 个 INSERT 语句 运行 起 来 ， 它 应 该 会 使 得 我 们 的 服务 器 卡 住 一 段 时 间 。 而 现在 我 们 希 
望 ， 如 果 有 人 正在 查询 bird_sightings 表 的 数据 ， 那 就 把 INSERT 押 后 ， 等 那 人 查 完 再 执 
行 。LOW_PRIORITY 就 能 做 到 这 一 点 ， 它 将 等 待 MySQL 做 完 其 他 所 有 事情 后 ， 再 输入 数据 。 
以 下 是 它 的 使 用 方法 : 


INSERT LOW_PRIORITY INTO bird_sightings 
















































































当然 ， 现 实 中 的 INSERT 语句 会 有 列 声明 和 值 的 集合 (在 省 略 号 处 ) 。 


LOW_PRIORITY 标志 使 得 该 INSERT 语句 被 放 到 一 个 队列 中 ， 并 等 待 其 他 正在 处 理 和 准备 处 理 
的 请 求 完 成 后 ， 再 去 执行 。 如 果 低 优先 级 的 语句 未 被 处 理 ， 而 又 有 人 发 起 一 个 新 的 请 求 ， 
那么 这 个 请 求 也 是 放 在 队列 的 前 端 。MySQL 只 会 在 处 理 完 前 面 的 请 求 之 后 ， 才 去 执行 低 
优先 级 的 语句 。 


插入 执行 时 ， 其 他 请 求 都 得 等 待 它 做 完 才能 被 处 理 。 低 优先 级 的 语句 开始 执行 时 ，MySQL 
就 会 锁 住 相关 的 表 ， 以 阻止 其 他 并 发 的 插入 。MySQL 不 会 中 断 进 行 中 的 LOW_PRIORITY 插 
入 ， 并 容许 其 他 数据 更 改 。 顺 便 说 一 下 ，InnoDB 引擎 的 表 不 支持 LOW_PRIORITY 和 HIGH_ 
PRIORITY， 因 为 InnoDB 只 锁定 相关 的 行 而 不 锁定 整个 表 ， 所 以 这 两 个 选项 对 它 没 有 意义 。 


因为 mysql 必须 等 待 服务 器 执行 完 语句 才能 恢复 使 用 ， 所 [以 INSERT LOW_PRIORITY 可 能 会 造 
成 一 些 不 便 。 如 果 你 用 mysql 连接 一 个 繁忙 的 服务 器 ， 并 执行 低 优先 级 的 INSERT， 那 么 你 
的 mysql 就 可 能 会 定 住 几 分 钟 ， 其 至 儿 小 时 ， 这 具体 得 看 那个 服务 器 忙 到 什么 程度 。LOW_ 
PRIORITY 会 使 你 客户 端 一 直 处 于 等 待 状态 ， 直 到 服务 器 开始 执行 插入 ， 然 后 客户 端 被 锁 
定 ， 就 如 同 表 被 锁定 一 样 。 

2. 延迟 插入 

你 可 以 不 用 Low_PRIORITY， 而 用 DELAYED。 不 过 MySQL 从 5.5.6 开始 ， 不 提倡 使 用 它 了 。 
如 果 你 还 用 着 旧版 本 ， 那 么 可 以 这 样 用 它 : 
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INSERT DELAYED INTO bird_sightings 


这 跟 LOW_PRIORITY 很 像 ，MySQL 会 将 此 语句 先 记 为 低 优先 级 ， 然 后 在 空闲 时 再 执行 。 它 
与 LOW_PRIORITY 相 比 ， 区 别 在 于 ， 或 者 说 优势 在 于 ， 它 不 会 定 住 mysql， 所 以 你 可 以 接着 
输入 其 他 命令 ， 甚 至 退出 nysqL。 另 外 ， 多 个 INSERT DELAYED 还 可 以 被 集合 起 来 ， 在 服务 
器 空 档 时 成 批 执 行 ， 这 样 可 能 会 比 INSERT LOW_PRIORITY 更 加 高 效 。 


而 缺点 就 是 ， 它 不 会 通知 客户 端 延迟 插入 是 否 已 做 。 如 果 该 SQL 语句 解析 得 有 错 ， 那 么 你 
还 是 能 收 到 错误 信息 的 ， 因 为 SQL 语句 在 入 队 前 ， 必 须 先 解析 验证 。 但 是 它 执行 时 所 产生 
的 问题 ， 不 会 返回 给 你 。 


由 此 我 们 还 能 看 出 另 一 个 问题 ， 延迟 的 插入 命令 保存 在 服务 器 内 存 中 。 如 果 MySQL 守护 
进程 停 掉 ， 或 被 人 为 杀 掉 ， 那 么 该 命令 就 会 丢失 ， 而 客户 端 也 不 会 收 到 失败 提示 。 你 只 能 
自行 检查 数据 或 者 查看 服务 器 日 志 ， 来 确定 它 是 否 插 入 成 功 。 所 以 ，DELAYED 也 不 总 是 绝 
佳 的 选择 。 

3. 提升 INSERT 的 优先 级 

HIGH_PRIORITY 是 第 三 种 优先 级 选项 。 你 可 能 会 觉得 它 没 有 必要 ， 因 为 INSERT 语句 本 来 
默认 就 是 优先 于 其 他 只 读 的 SQL 语句 的 。 但 是 ， 这 个 默认 设 定 ( 即 INSERT 先 于 SELECT) 
是 有 可 能 被 改写 的 。 在 2.6 节 中 ， 我 们 提 过 MySQL 和 MariaDB 的 配置 。 其 中 一 项 就 是 
--low-priority-updates。 它 会 使 得 写 入 语句 变 为 低 优先 级 语句 ， 或 使 其 优先 级 至 多 等 同 于 
只 读 语句 。 如 果 你 的 服务 器 被 设 定 了 这 一 项 ， 那 么 你 可 以 在 INSERT 中 加 上 HIGH_PRIORITY 
以 覆盖 该 设 定 ， 使 INSERT 先 于 SELECT。 


6.4 ”小结 


现在 ， 你 应 该 对 MySQL 和 MariaDB 有 了 清晰 的 理解 。 你 应 该 知道 了 数据 库 和 表 的 基本 结 
构 ， 还 应 该 认识 到 了 构建 多 个 小 表 的 好 处 。 你 不 会 再 将 数据 库 看 成 一 个 巨大 的 表 ， 或 者 是 
一 个 电子 表格 系统 。 你 应 该 知道 列 是 什么 ， 以 及 如 何 往 其 中 输入 数据 。 如 果 你 已 做 完 前 两 
章 的 习题 ， 那 么 这 对 你 来 说 应 该 是 很 简单 的 问题 。 暂 时 来 说 ， 掌 握 以 上 内 容 就 够 了 。 

第 7 章 会 深入 讲解 如 何 使 用 SELECT 语句 从 表 中 获取 数据 。 此 前 我 们 已 多 次 用 过 SELECT。 
然而 ， 那 都 只 是 为 了 验证 数据 输入 而 做 的 ， 只 使 用 到 SELECT 的 一 般 功能 。 下 一 章 会 介绍 
SELECT 的 更 多 细节 。 

INSERT、SELECT 和 UPDATE 是 最 常 使 用 的 SQL 语句。 如 果 你 想 学 好 MySQL 和 MariaDB， 
那 就 必须 先 掌握 它们 。 关 于 SELECT 语句 ， 除 了 基本 的 操作 ， 你 还 得 熟悉 它 一 些 特别 的 使 用 
方法 。 而 读 完 下 一 章 ， 你 就 能 做 到 了 。 

不 过 ， 在 进入 下 一 章 之 前 ， 先 完成 以 下 习题 。 它 们 能 助 你 巩固 本 章 所 学 的 INSERT 语句 的 知 
识 。 请 不 要 跳 过 它们 ， 因 为 它们 能 为 你 的 学 习 打 好 基础 。 
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6.5 习题 


以 下 是 有 关 使 用 INSERT 语句 和 本 章 所 学 其 他 内 容 的 一 些 习 题 。 其 中 有 些 习 题 需要 你 先 创 建 
本 章 提 到 的 一 些 表 ， 所 以 你 要 做 的 不 仅仅 是 插入 数据 。 建 表 的 练习 能 使 你 更 好 地 理解 数据 


的 输入 。 而 输入 数据 又 能 让 你 
建立 一 个 birds_body_shapes 表 。 此 表 的 数据 可 用 于 识别 各 种 鸟 。 





(第 4 章 结尾 曾经 要 求 你 











卦 建 表 有 更 加 理智 的 认识 。 它 们 是 相辅相成 的 。 


它 的 body_id 会 被 birds 表 引 用 。 该 表 包 含 岛 的 各 种 体型 的 描述 ， 并 且 这 个 描述 是 识别 
岛 种 的 关键 信息 : 如 果 有 种 鸟 看 起 来 像 鸡 子 ， 走 起 来 像 网 子 ， 叫 起 来 也 像 鸡 子 ， 那 么 它 








可 能 是 和 执 


Hummingbird 
Long-Legged Wader 
Marsh Hen 

Owl 

Perching Bird 
Perching Water Bird 
Pigeon 

Raptor 

Seabird 

Shore Bird 

Swallow 

Tree Clinging 
Waterfow1l 
Woodland Fow!l 


用 多 行 语法 





body_shapes 表 。 其 中 body_id 


参考 体型 的 名 称 (例如 ， 


相同 就 行 。 而 body_shape 列 ， 就 用 上 





但 绝 不 可 能 是 蜂鸟 。 以 下 就 是 体型 名 称 的 列表 : 





(不 是 明确 插入 的 那 种 )， 写 一 个 INSERT 语句 ， 用 于 插入 数据 到 birds_ 





是 三 个 字母 组 成 的 代码 ， 具 体内 容 由 你 来 定 ， 你 也 可 以 
MHN 代表 Marsh Hen， 而 Owl 就 直接 用 OWL)。 只 要 是 各 不 
而 给 的 内 容 填 ， 当 然 你 也 可 以 自 定 名 称 。 第 三 列 




















body_example， 和 暂时 先 不 管 。 
(2) 除 此 之 外 ， 第 4 章 结 尾 还 让 你 建 birds_wing_shapes 表 ， 它 用 来 存放 鸟 强 形状 的 数据 ， 
也 是 用 于 识别 鸟 种 的 。 以 下 是 那些 形状 的 名 称 的 初始 列表 : 





Broad 
Rounded 
Pointed 
Tapered 
Long 

Very Long 


用 明确 插入 的 方式 ( 带 SET 子 句 )， 构 造 一 个 INSERT 语句 ， 将 以 上 项 目 插入 birds_ 
wing_shapes 表 中 。 其 中 wing_id 由 两 个 字母 组 成 。 内 容 随 你 定 ， 就 像 刚 才 的 body_id 
那样 。wing_shape 用 上 面 给 出 的 内 容 填 。 而 wing_example 暂时 不 输入 。 

(3) 最 后 一 个 鉴别 鸟 种 的 表 是 birds_bill_shapes。 也 是 用 INSERT 来 录入 数据 ， 但 语法 随 








你 喜欢 。biLL_id 使 用 你 
列表 : 





自 定 的 两 个 字母 。bill_example 不 输入 。bill_shape 使 用 以 下 








All Purpose 
Cone 

Curved 

Dagger 

Hooked 
Hooked Seabird 
Needle 
Spatulate 
Specialized 


(4) 用 SELECT 语句 ， 查 出 birds_body_shapes 表 中 body_shape 为 Woodland Fowl 的 行 。 然 
后 把 它 body_shape 的 值 改 成 Upland Ground Birds。 要 求 使 用 6.3.4 节 中 提 及 的 REPLACE 
语句 。 你 可 在 其 VALUES 子 句 中 ， 带 上 刚才 查 出 的 该 行 的 body_id， 以 使 其 真 的 执行 替换 
动作 。 
执行 完 REPLACE 后 ， 用 SELECT 来 查询 birds_body_shapes 表 的 所 有 行 。 检 查 那 一 行 改 成 
了 什么 样子 。 确 保 它 改 对 了 。 如 果 不 对 ， 用 REPLACE 或 UPDATE 再 做 一 次 。 
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第 7 章 


查询 数据 





前 面 几 章 讲 了 两 个 重要 的 问题 : 如 何 组 织 好 表 ， 以 及 如 何 将 数据 录入 表 中 。 但 要 是 不 懂 
怎样 从 数据 库 中 获取 数据 ， 那 你 放 多 少 东 西 进去 都 没什么 用 。 所 以 ， 本 章 就 来 谈 谈 数据 
库 查 询 。 

要 从 MySQL 或 MariaDB 获取 数据 (或 者 说 查询 数据 )， 最 简单 的 方法 就 是 使 用 SQL 语句 
SELECT。 之 前 的 章节 中 我 们 有 儿 次 用 到 过 它 ， 而 这 一 章 将 会 对 它 进行 详解 。 我 们 没有 必要 
知道 或 使 用 它 所 有 的 形式 ， 而 像 表 连接 这 样 的 技术 ， 则 是 使 用 关系 型 数据 库 的 基本 技能 ， 
是 我 们 必须 懂得 的 。 

我 们 会 先 回顾 一 下 有 关 SELECT 语句 的 基础 知识 ， 然 后 再 看 看 它 的 各 种 变 体 。 学 完 本 章 之 
后 ， 你 会 懂得 如 何 使 用 SELECT 语句 完成 数据 库 开发 的 大 部 分 工作 ， 并 准备 好 迎接 未 来 各 种 
可 能 发 生 的 特殊 情况 。 

在 之 前 的 章节 中 ， 尤 其 是 在 习题 中 ， 我 曾 请 你 往 那 些 我 们 创建 和 更 改过 的 表 中 录入 数据 。 
当时 的 手动 录入 是 一 种 练习 。 但 现在 我 们 需要 更 多 的 测试 数据 ， 以 便 本 章 的 示例 代码 能 得 
出 一 些 比较 贴近 现实 的 结果 。 请 到 本 书 的 网 站 (http:/mysqlresources.comyfiles) 下 载 含 有 
量 数据 表 的 dump 文件 。 

请 下 载 rookery.sql， 来 获取 整个 rookery 数据 库 ， 甚 中 包括 大 量 的 数据 ， 我 们 可 以 在 学 习 
的 过 程 中 使 用 它 。 下 载 好 dump 文件 后 (假设 你 把 它 放 在 /tmp/rookery.sql) ， 在 命令 行 输入 
以 下 命令 : 


mysql --user='your_name' -p \ 
rookery < /tmp/rookery.sql 


此 命令 会 根据 所 填 用 户 名 来 提示 输入 密码 ， 然 后 登录 ， 在 rookery 数据 库 里 执行 rookery. 
sql 文件 中 的 语句 。 若 一 切 正 常 ， 应 该 不 会 有 任何 回应 ， 最 后 会 返回 到 命令 行 提示 符 。 
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7.1 基本 查询 
SELECT 语法 的 基本 元 素 ， 就 是 SELECT 这 个 关键 字 ， 还 有 你 想 查 询 的 列 ， 以 及 这 些 列 所 属 
的 表 : 
SELECT column FROM table; 
如 果 你 想 查 询 多 列 ， 就 以 逗号 分 隔 。 如 果 想 查询 所 有 列 ， 可 以 用 星 号 通配符 ,而 不 需要 将 


所 有 列 名 全 部 写 出 。 现 在 就 用 刚刚 导入 了 数据 的 rookery 数据 库 ， 来 举 个 基本 语法 的 例子 。 
输入 以 下 语句 ， 以 获取 birds 表 的 所 有 行 和 所 有 列 : 


USE rookery; 











SELECT * FROM birds; 


这 是 能 成 功 执行 的 最 短小 的 SELECT 语句 。 它 指示 MySQL 获取 birds 表 内 的 所 有 数据 。 

果 中 列 的 顺序 和 你 在 CREATE TABLE 或 ALTER TABLE 中 所 定义 的 一 样 ， 而 行 人 
们 在 表 中 被 找 出 的 顺序 ， 通 常会 如 同 插入 时 的 顺序 。 

若 只 想 查 出 某 些 列 ， 可 以 用 类 似 下 面 的 语句 : 


SELECT bird_id, scientific name, common_name 
FROM birds; 


此 语句 只 查 出 birds 表 中 每 一 行 的 三 个 列 。 当 然 ， 只 查 出 某 些 行 ， 按 某 种 顺序 显示 行 或 限 
定 显示 的 行 数 ， 都 是 可 以 的 。 这 些 会 在 本 章 接 下 来 的 几 节 中 讲 到 。 


7.2 ”有 条 件 地 查询 


假设 我 们 只 想 查 出 某 一 科 的 鸟 ， 如 Charadriidae ( 即 Plover)。 从 bird_families 表 可 知 ， 
它 的 family_id 是 103。 于 是 ， 我 们 在 SELECT 语句 中 使 用 WHERE 子 句 ， 从 birds 表 中 获取 
这 一 科 的 鸟 种 列表 : 


SELECT common_name, scientific_name 
FROM birds WHERE family_id = 103 





























LIMIT 3; 
+---------------------- +------------------------- 十 
| common_name | scientific name 

+---------------------- +------------------------- + 
| Mountain Plover | Charadrius montanus | 
| Snowy Plover | Charadrius alexandrinus | 
| Black-bellied Plover | Pluvialis squatarola | 
+---------------------- +------------------------- 十 


此 SELECT 语句 要 求 返 回 两 列 ， 并 且 排 位 与 定义 表 时 所 排 的 “scientific_name 先 于 common_ 
name” 不 同 。 并 且 我 还 加 了 LIMIT 子 句 ， 使 结果 只 显示 头 三 行 。 至 于 LIMIT 子 句 ， 我 会 在 
稍 后 讲 到 。 
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丸 为 我 们 将 科 的 信息 放 在 了 另 一 个 表 中 ， 所 以 必须 在 查询 birds 之 前 ， 先 从 
bird_families 找 出 相应 的 ID。 这 看 起 来 好 像 络 了 一 圈 。 其 实 我 们 有 更 简捷 
的 方法 ， 可 以 直接 使 用 Charadriidae 而 不 是 一 个 数字 来 查询 。 该 方法 叫 作 表 
连接 。 我 们 会 在 后 面 讲 到 。 














以 上 例子 很 简单 ， 而 且 我 们 在 之 前 的 章节 中 也 看 到 过 。 接 下 来 我 们 再 进一步 ， 看 看 如 何 调 
整 结果 集 的 顺序 。 


7.3 结果 排序 


上 例 从 birds 表 获 取 了 指定 的 列 ， 并 且 用 LIMIT 来 限定 了 行 数 。 所 得 的 行 的 排序 方式 取决 
于 它们 在 表 中 被 找到 的 顺序 。 因 为 我 们 只 显示 Charadriidae 科 所 含 鸟 种 的 一 小 部 分 ， 所 以 
排序 对 最 终结 果 有 很 大 影响 。 如 果 想 让 结果 按照 common_name 列 的 值 的 字母 序 来 排列 ， 可 
以 这 样 加 上 ORDER BY 子 句 : 

SELECT common_name, scientific_name 

FROM birds WHERE family_id = 103 


ORDER BY common_name 
LIMIT 3; 


+----------------------- +---------------------- + 
| common_name | scientific_ name | 
+----------------------- +---------------------- 十 
| Black-bellied Plover | Pluvialis squatarola | 
| Mountain Plover | Charadrius montanus | 
| Pacific Golden Plover | Pluvialis fulva | 
+----------------------- +---------------------- + 


注意 ，ORDER BY 是 放 在 WHERE 之 后 、LIMIT 之 前 的 。 于 是 ， 此 语句 不 但 使 结果 按 common_ 
name 来 排序 ， 还 按 此 顺序 取 头 三 行 。 这 意味 着 ，MySQL 先 按 WHERE 子 句 获取 所 有 行 ， 并 
在 幕后 将 此 结果 集 存放 于 一 个 临时 表 中 ， 然 后 根据 ORDER BY 子 句 对 该 表 排 序 ， 最 后 根据 
LIMIT 子 句 获取 排序 后 的 表 的 前 三 行 。 这 就 是 为 什么 我 们 要 将 这 三 个 子 句 按 这 样 的 次 序 
来 写 。 

ORDER BY 子 句 默认 是 升序 的 ， 即 从 A 到 Z 往 下 排 。 如 果 你 想 逆 序 ， 可 加 上 DESC 选项 ， 即 
ORDER BY DESC。 相 对 的 ， 也 有 表示 升序 的 ASC 选项 ， 不 过 一 般 是 不 需要 用 的 ， 因 为 默认 就 
是 升序 。 


若 想 按 多 列 排序 ， 只 需 在 ORDER BY 后 给 出 这 些 列 ， 并 用 去 号 分 隔 即 可 。 你 可 以 指定 各 列 升 
序 还 是 逆序 。 这 种 写法 会 使 得 结果 先 按 首先 指定 的 列 来 排 ， 之 后 再 按 后 指定 的 列 来 排 ， 并 
且 不 违反 前 面 已 排 好 的 顺序 。 为 了 演示 这 种 排序 方式 ， 我 们 再 多 查 一 列 ， 即 family_id， 
并 且 不 只 查 一 科 。 我 们 会 查 出 更 多 的 岸 岛 : Oystercatchers ( 即 Haematopodidae)、Stilts 
( 即 Recurvirostridae) 和 Sandpipers ( 即 Scolopacidae) 。 首 先 输 入 以 下 命令 ， 得 出 这 些 科 的 
family_id.: 











上 














SELECT * FROM bird_families 
WHERE scientific_name 
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IN('Charadriidae','Haematopodidae','Recurvirostridae','Scolopacidae'); 


+----------- +------------------ +- +---------- 十 
| family _ id | scientific name | brief_description | order_id | 
+----------- +------------------ +------------------------------ +---------- + 
| 103 | Charadriidae | Plovers, Dotterels, Lapwings | 102 | 
| 160 | Haematopodidae | Oystercatchers | 102 | 
| 162 | Recurvirostridae | Stilts and Avocets | 102 | 
| 164 | Scolopacidae | Sandpipers and Allies | 102 | 
+----------- +------------------ +- +---------- + 


我 们 在 此 语句 的 WHERE 子 句 中 增加 了 一 个 IN 运算 符 。 在 其 后 的 括号 中 ,我们 可 以 指定 
多 个 用 于 匹配 scientific_name 的 值 。 现 在 ， 查 询 birds 表 ， 再 一 次 使 用 IN， 并 且 加 上 
LIMIT 子 句 : 

SELECT common_name, scientific_ name, family_id 

FROM birds 


WHERE family_id IN(103, 160, 162, 164) 
ORDER BY common_name 




















LIMIT 3; 

+---- +- +---- + 
| common_name | scientific_ name | family_id | 
+---- +- +----- + 
| | Charadrius obscurus aquilonius | 103 

| | Numenius phaeopus phaeopus | 164 | 
| | Tringa totanus eurhinus | 164 | 
+---- +- +----------- + 





主意 ， 之 前 查 bird_families 时 ，IN 中 的 值 加 了 引号 ， 而 这 次 的 数字 值 则 没有 加 引号 。 对 
于 字符 素来 说 ， 我 们 必须 要 加 单 引 号 或 双 引 号 。 而 对 于 数字 值 来 说 ， 最 好 不 要 加 引号 ， 
为 这 会 影响 性 能 ， 而 且 跟 字符 串 混在 一 起 时 ， 会 导致 错误 的 结果 。 


此 结果 集 有 个 很 奇怪 的 地 方 : 全 都 没有 俗名 。 这 是 正常 的 。birds 表 中 大 约 有 10 000 种 鸟 
是 真 种 ， 还 有 20 000 种 左右 是 亚 种 。 很 多 恶 种 是 设 有 自己 的 俗名 的 。 真 种 和 亚 种 的 数量 如 
此 之 多 ， 而 亚 种 之 间 的 差别 又 如 此 之 小 ， 所 以 没 办 法 给 它们 全 部 都 起 个 俗名 。 乌 类 学 家 会 
给 每 种 鸟 都 起 个 学 名 ， 而 普通 人 看 不 出 各 种 鸟 之 间 的 细微 差异 ， 会 把 一 个 俗名 用 在 多 种 鸟 
上 。 所 以 scientific_name 是 必 填 的 ， 而 common_name 则 不 是 ， 它 不 能 作为 键 。 


现在 再 执行 一 次 刚才 的 SQL 语句 ， 但 在 WHERE 子 名 中 增加 一 个 参数 ， 限 定 只 显示 common_ 
nane 有 值 的 行 ; 


SELECT common_name, scientific _ name, family_id 
FROM birds 

WHERE family_id IN(103, 160, 162, 164) 

AND common_name != "" 

ORDER BY common_name 







































































LIMIT 3; 

+----------------------- +----------------------- +----------- 十 
| common_name | scientific_name | family_id | 
+----------------------- +----------------------- +----------- 十 
| African Oystercatcher | Haematopus moquini | 160 | 





| African Snipe | Gallinago nigripennis | 164 | 
| Amami Woodcock | Scolopax mira | 164 | 


在 WHERE 子 句 中 ， 我 们 使 用 逻辑 运算 符 AND， 添加 了 第 二 个 过 滤 条 件 。 这 样 就 能 查 出 
family_id 在 103、160、162、164 之 中 ， 而 且 common_name 不 为 空 的 行 。 


非 程序 员 可 能 需要 先 了 解 一 些 编写 大 型 WHERE 子 句 的 惯例 。 之 前 我 们 见 过 ， 等 号 可 用 于 表 
示 “ 该 列 必须 含有 此 值 *， 而 现在 看 到 的 != 则 是 指 “ 该 列 不 能 含有 此 值 *。 在 上 例 中 ， 我 
们 用 了 '' 来 指 代 空 字符 串 。 于 是 ， 我 们 就 查 出 了 具有 俗名 的 行 。 
注意 ， 我 们 并 不 是 要 求 非 NULL。 你 可 以 让 birds 表 的 common_name 默认 为 NULL， 但 我 
还 是 决定 用 空 字符 串 。 它 与 NULL 是 完全 不 同 的 : NULL 表示 没有 值 ， 而 空 字符 串 虽 然 不 
含 字符 ， 但 它 仍 然 是 一 个 字符 串 。 因 为 设置 了 默认 值 是 空 字 符 串 ， 所 以 匹配 时 也 得 用 相应 
的 值 。 
顺便 说 一 下 ，!= 还 可 以 写成 <> 〈 即 一 个 小 于 号 后 接 一 个 大 于 号 )。 


7.4 限定 结果 集 


birds 表 有 将 近 30 000 行 ， 如 果 不 限定 查询 的 数据 ， 那 返回 结果 可 能 会 多 于 你 一 次 想 看 的 
数量 。 而 LIMIT 就 是 用 于 解决 这 个 问题 的 ， 我 们 已 经 试 过 用 它 来 将 SELECT 的 结果 限定 为 三 
行 ， 当 时 是 根据 WHERE 和 ORDER BY 所 得 出 的 结果 显示 头 三 行 。 如 果 想 查看 接 下 来 的 行 ， 比 
如 说 根据 之 前 条 件 所 得 的 结果 集 的 下 两 行 ， 那么 可 以 限定 五 行 。 不 过 ， 更 好 的 做 法 如 下 : 

SELECT common_name, scientific name, family_id 

FROM birds 

WHERE family_id IN(103, 160, 162, 164) 

AND common_name != "" 


ORDER BY common_name 
LIMIT 3, 2; 






















































































+------------------------ +------------------------- +----------- + 
| common_name | scientific name | family_id | 
+------------------------ +------------------------- +----------- + 
| American Avocet | Recurvirostra americana | 162 | 
| American Golden-Plover | Pluvialis dominica | 103 | 
+------------------------ +------------------------- +----------- 十 


这 个 LIMIT 子 句 带 了 两 个 值 ， 一 个 是 开始 位 置 ， 一 个 是 行 数 。 结 果 是 第 3 行 和 第 4 行 。 顺 
便 说 一 下 ， 之 前 用 的 LIMIT 3 其 实 可 以 写成 LIMIT 69，3: 0 能 保证 不 跳 过 任何 行 。 


7.5 ” 表 连 接 
从 本 章 开 始 到 现在 ， 我 们 每 次 都 只 操作 一 个 表 。 现 在 就 来 看 看 一 些 从 多 个 表 中 获取 数据 的 
方法 。 这 时 ， 我 们 得 指示 MySQL， 需 要 从 哪些 表 抓 数据 ， 以 及 如 何 连 接 这 些 表 。 


例如 ， 试 试 查询 一 些 鸟 种 及 其 各 自 对 应 的 科 。 为 了 简单 起 见 ， 我 们 就 查 同 一 目 而 不 同 科 的 
岛 。 在 前 面 查询 岸 鸟 的 例子 中 ， 我 们 看 到 那些 鸟 的 order_id 都 是 102。 那 我 们 就 直接 用 这 
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个 。 输 入 以 下 SELECT 语句 ， 


SELECT common_name AS "Bird ' ， 
bird_families.scientific_name AS 'Family' 

FROM birds, bird_families 

WHERE birds.family_id = bird_families.family_id 
AND order_id = 102 

AND common_name != "" 

ORDER BY common_name LIMIT 10; 


+------------------------ +------------------ + 
| Bird | Family 
+------------------------ +------------------ + 
| African Jacana | Jacanidae | 
| African Oystercatcher | Haematopodidae | 
| African Skimmer | Laridae | 
| African Snipe | Scolopacidae 

| Aleutian Tern | Laridae | 
| Amami Woodcock | Scolopacidae 

| American Avocet | Recurvirostridae | 
| American Golden-Plover | Charadriidae | 
| American Oystercatcher | Haematopodidae | 
| American Woodcock | Scolopacidae | 
+------------------------ +------------------ + 


此 SELECT 语句 返回 birds 表 和 bird_families 表 的 各 一 列 。 这 条 语句 有 点 长 ， 别 急 。 它 跟 
本 章 之 前 的 那些 语句 是 相似 的 ， 大 的 改动 只 有 一 处 ， 其 他 都 只 是 轻微 变化 。 我 们 首先 关注 
一 下 那个 大 改动 : 它 如 何 帮助 我 们 从 两 个 表 中 获取 数据 。 


在 FROM 子 句 中 ， 我们 用 逗号 分 阳 ， 列 出 了 两 个 表 。 而 在 WHERE 子 句 中 ， 我 们 指定 了 所 需 的 
行 ， 是 在 另 一 个 表 中 能 找到 相同 family_id 的 那些 。 如 果 不 这 样 指 定 ， 结 果 中 就 会 出 现 重 
复 的 行 。 而 因为 两 个 表 都 有 family_id 列 ， 为 避免 名 字 混 清 ， 我 们 需要 在 列 名 前 加 上 表 名 ， 
并 且 表 名 和 列 名 之 间 用 一 个 点 来 分 隔 ( 即 birds.family_id)。 对 于 SELECT 后 的 学 名 列 ， 也 
是 这 种 做 法 (bird_families.scientific_name)。 如 果 不 这 么 做 ，MySQL 会 搞 不 清 我 们 想 
要 的 是 birds 的 scientific_name 还 是 bird_families， 并 导致 以 下 报错 信息 : 


ERROR 1052 (23000): Column 'scientific name' in field list is ambiguous 


你 可 能 还 注意 到 SELECT 中 多 了 个 新 东西 : AS 关键 字 。 它 用 于 为 结 吉 采 集 的 标题 声明 一 个 
替代 名 称 ， 或 者 说 别名 。 如 果 科 名 那 列 设 用 As， 那 么 标题 就 会 显示 为 bird_fanmilies. 
scientific_nane。 这 样 就 不 够 好 看 了 。 这 可 以 说 是 另 一 种 风格 ， 接 下 来 ， 我 们 还 会 看 到 它 
的 实用 之 处 。 除 了 列 名 ，As 还 可 为 表 起 别名 ， 如 下 所 示 : 


SELECT common_name AS "Bird '， 
families.scientific_name AS "FamiLy' 

FROM birds, bird_families AS families 
WHERE birds.family_ id = families.family_id 
AND order_id = 102 
AND common_name != 
ORDER BY common_name LIMIT 10; 


此 例 中 ， 我 们 为 bird_families 起 了 一 个 更 短 的 名 字 ， 那 就 是 families。 注 意 ， 表 的 别名 
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不 能 加 引号 。 


一 且 给 表 声 明了 别名 ， 于 都 得 使 用 该 别名 。 所 以 ，SELECT 中 
的 bird_families.scientific_name 需 改 为 families.scientific_name,，WHERE 中 的 bird_ 


families.family_id 需 改 为 families.family_id。 如 果 不 改 ， 就 会 有 以 下 报错 信息 : 


ERROR 1054 (42S22) : 
Unknown coLumn 'bird families.family id' in 'where CLause' 


现在 ， 给 该 语句 加 上 第 三 个 表 ， 以 获取 每 种 鸟 的 目的 名 称 。 做 法 如 下 : 


SELECT common_name AS 'Bird '， 

families.scientific_name AS 'Family', 

orders.scientific_name AS 'Order' 

FROM birds, bird_families AS families, bird_orders AS orders 
WHERE birds.family_id = families.family_id 

AND families.order_id = orders.order_id 

AND families.order_id = 102 

AND common_name != "" 

ORDER BY common_name LIMIT 10, 5; 


+------------------ +------------------ +----------------- + 
| Bird | Family | Order | 
+------------------ +------------------ +----------------- + 
| Ancient Murrelet | Alcidae | Charadriiformes | 
| Andean Avocet | Recurvirostridae | Charadriiformes | 
| Andean Gull | Laridae | Charadriiformes | 
| Andean Lapwing | Charadriidae | Charadriiformes | 
| Andean Snipe | Scolopacidae | Charadriiformes | 
+------------------ +------------------ +----------------- 十 


来 看 看 它 跟 之 前 的 语句 有 什么 区 别 。 我 们 在 FROM 中 加 入 了 第 三 个 表 ， 并 且 给 了 它 一 个 别名 
(orders)。 为 了 正确 地 连接 第 三 个 表 ， 我 们 在 WHERE 中 增加 了 一 个 运算 逻辑 : fanmilies. 
order id = orders.order id。 这 使 得 SELECT 能 返回 与 families 相应 的 orders 的 行 的 
scientific_name 列 。 同 时 ， 我 们 还 在 SELECT 中 加 上 了 它 的 scientific_name 列 ， 以 显示 目 
的 学 名 。 因 为 我 们 所 查 的 科 都 属于 同一 目 ， 所 以 这 个 查询 结果 看 起 来 没什么 意义 。 不 过 我 
们 未 来 也 可 能 需要 查 不 同 的 目 ， 而 这 个 语句 到 时 还 是 适用 的 。 最 后 ， 我 们 在 LIMIT 中 指定 
了 起 始 行 数 ， 以 查 得 接 下 来 的 五 行 。 











如 果 列 的 别名 就 是 一 个 单词 ， 那 么 没有 必要 加 引号 。 否 则 ， 要 加 。 另 外 ， 保 
留 字 (如 Order) 也 要 加 引号 。 


7.6 表达 式 与 LIKE 


为 了 查 出 更 多 的 目 ， 我 们 来 改 改 刚才 的 SELECT 语句 。 先 看 看 WHERE 中 关于 common_name 的 


条 件 : 


有 








AND common_name != 


我 们 改 一 下 这 个 匹配 条 件 ， 换 成 LIKE 运算 符 (我 们 在 第 6 章 见 过 )， 使 之 查 出 各 种 相似 的 
俗名 。 虽 然 所 属 的 科 不 同 ， 但 有 些 岛 的 体型 大 小 是 相近 的 。 最 小 的 那些 鸟 ， 通 常 俗名 中 都 
带 有 Least 这 样 的 字眼 ， 于 是 我 们 就 查 查 俗名 中 含有 Least 的 鸟 : 


SELECT common_name AS 'Bird', 

famiLLies.scientific_name AS 'Family', 

orders.scientific_name AS 'Order' 

FROM birds, bird_families AS families, bird_orders AS orders 

WHERE birds.family_id = families.family_id 

AND families.order_id = orders.order_id 

AND common_name LIKE "Least% 

ORDER BY orders.scientific _ name, families.scientific_name, common_name 





LIMIT 10; 

+------------------ +--------------- +------------------ + 
| Bird | Family | Order | 
+------------------ +--------------- +------------------ + 
| Least Nighthawk | Caprimulgidae | Caprimulgiformes | 
| Least Pauraque | Caprimulgidae | Caprimulgiformes | 
| Least Auklet | Alcidae | Charadriiformes | 
| Least Tern | Laridae | Charadriiformes | 
| Least Sandpiper | Scolopacidae | Charadriiformes | 
| Least Seedsnipe | Thinocoridae | Charadriiformes | 
| Least Flycatcher | Tyrannidae | Passeriformes | 
| Least Bittern | Ardeidae | Pelecaniformes 

| Least Honeyguide | Indicatoridae | Piciformes | 
| Least Grebe | Podicipedidae | Podicipediformes | 
+------------------ +--------------- +------------------ + 


上 例 中 ，MySQL 根据 LIKE 的 条 件 ， 筛 选 出 了 开头 为 Least， 结 尾 为 任意 内 容 (% 通 配 符 ) 
的 common_name。 另 外 ， 因 为 我 们 去 掉 了 families.order_id = 102 子 句 ， 所 以 查 出 的 鸟 种 
不 限于 一 个 目 。 你 可 以 从 结果 中 看 到 有 不 同 的 目 名 。 


同时 ， 我 们 还 修改 了 ORDER BY 子 句 ， 使 MySQL 在 临时 表 中 将 结果 先 按 目的 学 名 排序 ， 再 
按 科 的 学 名 排序 ， 最 后 按 种 的 俗名 排序 。 看 看 最 终 出 来 的 结果 ， 你 就 会 知道 是 怎么 回 事 : 
首先 是 按 目 排序 。 然 后 ， 看 看 目 为 Charadriiformes 的 那些 行 ， 你 会 发 现 科 按 字母 序 排列 
了 。 而 对 于 科 名 同 为 Caprimulgidae 的 那 两 行 ， 是 按 种 的 俗名 来 排序 的 。 











在 ORDER BY 中 不 能 使 用 列 的 别名 ， 但 表 的 别名 则 可 以 。 事 实 上 ， 如 果 在 FROM 
中 指定 了 表 的 别名 ， 那 么 在 ORDER BY 中 就 必须 用 这 个 别名 。 




















刚才 我 们 是 使 用 LIKE 来 做 模式 匹配 的 。 除 此 之 外 ， 还 可 以 使 用 REGEXP， 它 支持 更 多 样 的 
模式 。 现 在 就 用 它 来 改写 上 面 的 语句 。 小 鸟 的 俗名 通常 以 Least 开头 ， 上 例 就 是 以 此 查询 
小 鸟 的 。 而 一 科 中 最 大 的 那些 鸟 ， 通 常 叫 Great。 为 了 同时 查 出 小 鸟 和 大 岛 ， 我 们 使 用 以 
下 SQL 语句: 
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这 里 ，REGEXP 所 卉 


SELECT common_name AS 'Birds Great and Small' 


FROM birds 


WHERE common_name REGEXP "Great|Least" 
ORDER BY family_id LIMIT 10; 


Great Northern 
Greater Scaup 


Greater White-fronted Goose 
Greater Sand-Plover 
Great Crested Tern 


Great Black-backed Gull 
Least Nighthawk 


| 

| 

| 

| 

| 

| Least Tern 
| 

| 

| Least Pauraque 
| 


Great Slaty Woodpecker 





带 的 表达 式 是 用 引号 包 目 


Loon 

















Ce 





起 来 的 两 个 值 : Great Least。MySQL 的 默认 


匹配 方法 ， 是 将 REGEXP 所 带 的 文本 与 列 中 值 的 开头 开始 匹配 。 车 想 强制 在 头 部 进行 匹配 ， 
SD be 不 过 这 里 不 需要 。 两 个 表达 式 之 间 的 竖 线 ( 即 


1)， 


你 会 、 




















表示 可 接受 两 种 值 ， 即 “或 ”的 意思 。 


会 发 现 ， 结 果 除 了 包含 Great 开头 的 俗名 ， 还 包含 了 一 些 以 Greater 开头 的 俗名 。 如 果 想 
排除 Greater， 可 以 使 用 NOT REGEXP 运算 符 ， 如 下 所 示 : 


SELECT common_name AS 'Birds Great and Small' 


FROM birds 





WHERE common_name REGEXP "Great|Least' 
AND common_name NOT REGEXP "Greater " 
ORDER BY family_id LIMIT 10; 


Great Northern 
Least Tern 


Least Pauraque 


Great BLack-backed Gull 
Great Crested Tern 
Least Nighthawk 


Great Slaty Woodpecker 
Great Spotted Woodpecker 
Great Black-Hawk 

Least Flycatcher 


---------- 十 
Small | 
---------- 十 
Loon | 
| 
| 
| 
| 
| 
| 
| 
| 
| 
---------- 十 





NOT REGEXP 消除 了 所 有 的 Greater 鸟 。 注 意 ， 我 们 要 用 AND 来 把 它 跟 其 他 条 件 并 起 来 ， 而 不 
是 将 它 写 在 原本 那个 REGEXP 中 。 


顺便 说 一 下 ， 


这 里 是 按 fanity_id 来 排序 的 ， 这 使 得 同 科 的 鸟 被 排 在 一 起 。 不 过 岛 的 名 字 





则 疫 有 顺序 ， 看 起 来 怪 怪 的 。 当 然 ， 我 们 可 以 在 ORDER BY 中 加 上 common_name， 使 得 同一 
科 的 鸟 按 字 母 序 排列 。 


REGEXP 和 NOT REGEXP 不 区 分 大 小 写 。 如 果 想 区 分 大 小 写 ， 则 需要 加 上 BINARY 选项 。 现 在 
我 们 用 另 一 组 鸟 来 做 例子 ， 讲 讲 这 个 问题 。 这 次 查询 的 是 Hawks， 注 意 它 是 以 大 写字 母 开 
头 的 。 上 有 具体 来 说 ， 结 果 必 须要 是 “ 座 ”"， 即 使 名 字 里 有 hawk 的 字眼 ， 但 如 果 不 是 大， 那 也 
不 能 算数 。 例 如 ，Nighthawks 和 Hawk-Owls 都 不 合格 。 因 为 在 birds 表 中 ,俗名 里 的 每 个 
单词 都 以 大 写字 母 开 头像 标题 一 样 )， 所 以 ， 使 用 Hawk 这 样 的 模式 〈 首 字母 大 写 ， 其 
余 小 写 )， 并 加 上 BINARY 选项 ， 就 可 以 剔 掉 Nighthawks 之 类 的 名 称 了 。 另 外 ， 我 们 还 要 用 
NOT REGEXP 来 排除 Hawk-Owls。 现 在 试 试 : 

SELECT common_name AS "Hawks' 

FROM birds 

WHERE common_name REGEXP BINARY 'Hawk' 


AND common_name NOT REGEXP "Hawk-0OwL' 
ORDER BY family_id LIMIT 10; 
















































































Red-tailed Hawk 

Bicolored Hawk 

Common Black-Hawk 
Cuban Black-Hawk 
Rufous Crab Hawk 
Great Black-Hawk 
Black-faced Hawk 
White-browed Hawk 
Ridgway's Hawk 

Broad-winged Hawk 














前 面 说 过 ，REGEXP 和 NOT REGEXP 不 区 分 大 小 写 ， 除 非 加 上 BINARY 选项 ， 如 上 例 ， 这 就 指 
定 了 它 按 二 进 制 来 对 比 ( 因 为 H 的 二进制 表示 与 的 是 不 同 的 )。 但 对 于 common_name 列 ， 
其 实 不 必要 指定 BINARY 选项 ， 因 为 它 已 经 使 用 了 二 进 制 校对 方式 。 这 是 我 们 在 第 4 章 开头 
建立 rookery 库 时 ， 无 意识 设 定 的 。 现 在 ， 用 以 下 语句 来 看 看 rookery 库 是 怎样 建 的 : 


SHOW CREATE DATABASE rookery \G 


























类 淡淡 火 火 火炎 炎炎 类 类 淡淡 火 火 火 火炎 大大 类 大 大火 火 火 类 1. row 类 淡淡 火 火 火炎 大 大 炎炎 淡淡 火 火 火炎 类 尖 类 火炎 淡淡 火炎 类 


Database: rookery 
Create Database: CREATE DATABASE ‘rookery. /*!40100 DEFAULT 
CHARACTER SET latin1 COLLATE latin1 bin */ 


其 中 COLLATE 子 句 设置 了 latin1_bin， 意 思 是 Latinl 二 进 制 。 因 此 ， 除 非 在 建 表 时 另外 
声明 ， 否 则 建 在 rookery 库 中 的 表 都 会 遵循 latin1_bin 这 一 设 定 。 再 看 看 birds 表 的 


common_name 是 如 何 设 定 的 : 





SHOW FULL COLUMNS 
FROM birds LIKE 'common_name' \G 
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类 淡淡 火 火 火炎 大 大 类 淡淡 火 火 火 火炎 大 汪汪 炎 汪汪 火炎 火炎 生 ， row 火光 炎炎 光 炎炎 类 大火 火 火 类 火光 类 火炎 天 类 火炎 天 类 类 大 类 


Field: common_name 
Type: varchar(255) 
Collation: Latin1_bin 
Null: YES 
Key: 
Default: NULL 
Extra: 
Privileges: select,insert,update,references 
Comment: 


以 上 语句 只 会 显示 common_name 的 相关 信息 。 注 意 ， 它 的 Collation 是 latin1_bin。 因 此 ， 
对 它 使 用 REGEXP 进行 正则 表达 式 匹 配 时 ， 就 是 区 分 大 小 写 的 ， 无 需 再 指定 BINARY。 


再 检查 一 下 birds 表 ， 我 们 发 现 有 些 鸟 的 俗名 是 没有 横 杠 的 ， 如 Hawk Owl。 这 样 就 没 法 
符合 我 们 刚才 给 的 Hawk-owt 条 件 了 。 另 外 ， 还 有 些 名 字 中 的 Hawk 并 不 是 首 字母 大 写 ， 所 
以 不 能 依赖 大 小 写 判断 。 上 面 的 代码 已 经 漏 掉 了 茶 些 鸟 ， 所 以 我 们 需要 修改 一 下 表达 式 : 

SELECT common_name AS ‘Hawks' 

FROM birds 

WHERE common_name REGEXP '[[:space:]]Hawk|[[.hyphen.]]Hawk' 


AND common_name NOT REGEXP 'Hawk-OwL|Hawk Owl' 
ORDER BY family_id; 


这 个 很 长 的 REGEXP 表达 式 使 用 了 字符 类 和 字符 名 。 它 们 的 书写 格式 是 ， 将 字符 类 置 于 两 
个 方 括号 中 ， 用 冒号 包围 (如 [[:atpha:]] 表示 字母 ) ， 字 符 名 则 使 用 方 括号 和 点 号 包围 
(如 [[.hyphen.]] 表示 横 杠 )。 你 应 该 能 猜 到 ， 我 们 要 找 的 是 common_name 含有 “ Hawk” 
或 “-Hawk” 的 行 一 一 即 在 Hawk 前 ， 要 有 一 个 空格 或 横 枉 。 对 于 Hawk 前 是 字母 的 那些 
名 称 (如 Nighthawk)， 是 不 合格 的 。 而 第 二 个 表达 式 则 用 于 排除 Hawk-Owl 和 Hawk Owl。 


MySQL 的 正则 表达 式 比 其 他 语言 如 Perl 和 PHP 更 宛 长 。 不 过 ， 它 们 对 于 一 些 基本 要 求 还 
是 可 行 的 。 对 于 复杂 的 正则 表达 式 ， 你 可 能 会 想 使 用 Perl DBI 之 类 的 API， 来 在 MySQL 
外 面 进行 数据 处 理 。 但 这 样 性 能 会 不 如 先 在 数据 库 内 进行 过 滤 ， 所 以 最 好 还 是 在 MySQL 
里 使 用 REGEXP。 


7.7 ”对 结果 集 进 行 计数 和 分 组 


在 之 前 的 很 多 示例 中 ， 因 为 结果 可 能 含有 几 千 行 ， 所 以 我 们 都 限定 了 返回 的 行 数 。 假 设 我 
们 想 知道 具体 有 多 少 行 ， 可 以 在 语句 中 加 一 个 国 数 ， 即 COUNT()。 来 看 看 它 的 使 用 方法 : 


SELECT COUNT(*) FROM birds; 































































































+---------- + 
| COUNT(*) | 
+---------- + 
| 28891 | 
+---------- + 


我 们 在 括号 中 填 入 星 号 ， 以 表示 需要 统计 所 有 行 。 如 果 不 填 星 号 ， 而 填 某 一 列 名 ， 则 表示 
只 统计 有 值 的 行 ， 即 让 MySQL 忽略 列 中 是 NULL 值 的 行 。 但 注意 ， 空 或 空 值 ( 即 '') 并 


下 
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` 会 被 忽略 。 




















知道 整个 birds 表 有 多 少 行 是 不 错 的 。 但 如 果 只 想 统计 某 部 分 呢 ?” 试 试用 COUNT() 来 计算 


某 一 科 (如 Pelecanidae， 即 Pelican) 的 行 数 。 输 入 以 下 SQL 语句 : 


SELECT families.scientific name AS 'Family', 
COUNT(*) AS 'Number of BiLrds' 

FROM birds, bird_families AS fanmilies 

WHERE birds.family_id = families.family_id 


AND families.scientific_ name = 'PeLecanidae' 
+---- +----------------- 十 
| Family | Number of Birds | 
+---- +----------------- + 
| Pelecanidae | 10 | 
+---- +----------------- 十 




















如 你 所 见 ，Pelecanidae 科 有 10 种 鸟 。 得 出 这 样 的 结果 是 因为 我 们 在 WHERE 子 句 中 限制 了 
Pelecanidae 的 查询 条 件 。 如 果 想 得 知 Pelican 所 属 的 目 (Pelecaniformes) 的 鸟 类 总 数 ， 可 








以 在 上 例 中 连接 bird_orders 表 。 在 mysql 客户 端 中 输入 以 下 命令 : 


SELECT orders.scientific_ name AS 'Order', 
families.scientific_name AS 'Family', 
COUNT(*) AS 'Number of BiLrds' 


FROM birds, bird_families AS families, bird_orders AS orders 


WHERE birds.family_id = families.family_id 
AND families.order_id = orders.order_id 


AND orders.scientific _ name = 'Pelecaniformes'; 

+---------------- +------------- +----------------- 十 
| Order | Family | Number of Birds | 
+--- +---- +----------------- 十 
| Pelecaniformes | Pelecanidae | 224 | 
+---------------- +------------- +----------------- 十 





结果 显示 共有 224 种 岛 属 于 Pelecaniformes 这 个 目 。 但 科 名 那 一 列 只 显示 了 第 一 个 找到 的 


科 。 如 果 想 要 得 出 每 个 科 的 名 字 和 鸟 种 数量 ， 就 需要 MySQL 对 结果 集 进行 分 组 。 你 得 告 
诉 MySQL 要 根据 哪 一 列 来 分 组 。 这 时 ， 就 要 靠 GROUP BY 子 句 了 。 它 所 带 的 值 就 是 分 组 的 


依据 。 现 在 看 看 它 的 用 法 ， 输 入 以 下 语句 : 


SELECT orders.scientific _ name AS 'Order', 
families.scientific name AS 'Family', 
COUNT(*) AS 'Number of BiLrds' 


FROM birds, bird_families AS families, bird_orders AS orders 


WHERE birds.family_id = families.family_id 
AND families.order_id = orders.order_id 

AND orders.scientific name = 'Pelecaniformes' 
GROUP BY Fanmily; 


+--- +------------------- +----------------- 十 
| Order | Family | Number of Birds | 
+---------------- +------------------- +----------------- 十 
| Pelecaniformes | Ardeidae | 1571| 
| Pelecaniformes | Balaenicipitidae | 1 | 
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| Pelecaniformes | Pelecanidae | 10 | 
| Pelecaniformes | Scopidae | 3 | 
| Pelecaniformes | Threskiornithidae | 53 | 
+---------------- +------------------- +----------------- + 


此 例 中 ，GROUP BY 子 句 带 有 Family 这 个 别名 ， 它 是 指 bird_families 表 的 scientific_ 
name 列 。MySQL 根据 这 一 条 语句 ， 返 回 了 含有 五 行 的 结果 集 。 


GROUP BY 很 有 用 ， 且 很 常用 ， 所 以 请 掌握 好 它 。 第 12 章 将 更 详细 地 介绍 该 子 句 及 相关 
函数 。 


7.8 小 结 


SELECT 语句 的 玩法 实在 太 多 了 ， 而 本 书 只 是 入 门 教程 ， 所 以 我 只 好 省 略 掉 一 些 ， 以 免 搞 得 
太 过 高 深 。SELECT 语句 有 多 个 缓存 结果 集 的 选项 ， 也 有 将 结果 集 导出 到 文本 文件 中 的 子 
句 。 如 果 你 需要 用 到 它们 ， 可 以 从 他 处 获取 相关 知识 。 


和 暂时 来 说 ， 你 得 先 确保 自己 已 掌握 SELECT 语句 及 其 主要 组 成 部 分 : 选取 列 并 为 其 设置 别 
名 ; 在 FROM 子 句 中 指定 多 个 表 ， 构建 WHERE 子 句 ， 包 括 使 用 正则 表达 式 ， 使 用 ORDER BY 
和 GROUP BY 子 句 ， 用 LIMIT 子 句 限制 返回 部 分 结果 集 。 想 要 完全 熟悉 以 上 内 容 ， 需 要 一 段 
时 间 的 练习 。 在 进入 第 8 章 之 前 ， 先 完成 以 下 习题 吧 。 


7.9 习题 


以 下 习题 能 使 你 加 深 对 SELECT 语句 的 理解 。 输 入 SQL 语句 ， 尤 其 是 像 SELECT 这 种 常用 的 
语句 ， 能 帮助 你 学 习 、 记 忆 和 熟悉 它们 。 
(1) 组 织 一 条 SELECT 语句， 从 birds 表 查 出 各 种 鸟 的 俗名 。 要 求 使 用 LIKE 来 只 选 出 
Pigeons。 还 有 ， 给 common_name 起 个 别名 Btrd， 并 使 结果 集 按 该 列 排序 。 不 限制 结果 集 
返回 行 数 ， 让 MySQL 查 出 全 部 符合 条 件 的 记录 。 执 行 此 语句 ， 看 看 结果 如 何 。 
接着 ， 给 该 语句 加 上 LIMIT 子 句 ， 使 其 只 显示 前 十 行 记录 。 将 执行 结果 和 之 前 的 SELECT 
比较 ， 看 看 是 否 是 前 十 行 。 然 后 改 成 显示 下 十 行 ， 执 行 后 再 和 第 一 次 的 结果 比较 ， 看 得 
到 的 是 否 是 第 11 行 到 第 20 行 。 如 果 有 错 ， 则 检查 并 修改 ， 直 至 正确 。 

(2) 本 题 会 以 一 个 简单 的 SELECT 语句 开始 ， 然 后 将 其 变 得 复杂 。 首 先 ， 组 织 一 条 SELECT 
语句 ， 从 bird_orders 表 查 出 scientific_name 列 和 brief_description 列 。 其 中 ， 
scientific_name 的 别名 为 Order 一 一 记得 加 上 引号 ， 因 为 它 是 保留 字 。 而 brief_ 
description 的 别名 则 为 Types of Birds in Order。 无 需 限 制 结果 集 。 写 好 后 ,执行 该 
语句 。 若 有 报错 ， 试 着 查找 原因 并 修复 ， 直 至 执行 成 功 。 

再 写 一 个 查 birds 表 的 SELECT 语句 。 要 求 查 出 common_name 列 和 scientific_name 列 。 
各 起 别名 为 Common Name of Bird 和 Scientific Name of Bird。 如 果 某 一 行 的 common_ 
name 为 空 ， 则 去 掉 此 行 。 结 果 按 common_name 排序 。 最 终 限制 显示 25 行 数据 。 执 行 语 
句 并 确保 无 误 。 

将 以 上 两 条 语句 合并 ,使 你 能 从 那 两 个 表 中 取 到 那 四 列 的 数据 ， 并 且 别 名 不 变 (相关 技 
巧 在 7.5 节 中 讲 过 )。 你 需要 在 FROM 子 句 中 声明 多 个 表 ， 并 且 在 WHERE 子 句 中 提供 表 连 
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接 的 条 件 。 这 道 题 有 点 绕 。 你 得 花 点 时 间 ， 千 万 不 要 气 蚀 。 如 果 有 必要 ， 也 可 以 重 温 
7 沪 坝 。 
将 最 终结 果 限 制 为 25 行 。 如 果 编 写 正 确 ， 那 么 出 来 的 鸟 种 应 该 会 与 之 前 单 查 birds 表 
所 得 的 结果 一 致 。 记 得 剔除 common_name 列 为 空 的 行 。 

(3) 使 用 在 WHERE 子 句 中 带 有 REGEXP 的 SELECT 语句 ， 人 
Pigeon 或 Dove 字眼 的 行 (相关 内 容 在 7.6 节 中 讲 过 )。 然 后 ， 给 common_name 起 个 别名 
Type of Columbidae 因为 Dove 和 Pigeon 都 属于 Columbidae 科 。 
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第 8 和 章 


更 新 和 删除 数据 





数据 库 中 的 数据 是 会 经 常 改变 的 。 有 时 可 能 是 添加 一 点 信息 ， 有 时 可 能 是 删除 某 条 记录 。 
对 于 修改 或 添加 某 部 分 数据 ， 主 要 是 用 UPDATE 语句 。 而 对 于 删除 整 条 记录 ， 基 本 上 就 是 用 
DELETE 语句 。 本 章 将 详细 介绍 这 两 个 SQL 语句 。 


8.1 更 新 数据 


UPDATE 语句 用 于 修改 现存 记录 的 某 些 列 里 的 值 。 甚 基本 语法 就 是 UPDATE 关键 字 ， 后 接 一 
个 表 名 ， 再 接 一 个 SET 子 句 。 一 般 来 说 ， 我 们 还 会 加 上 一 个 WHERE 子 句 ， 以 使 它 只 更 新 某 
些 行 。 以 下 是 UPDATE 的 简单 例子 : 


UPDATE table 
SET coLumn = value, ... ; 


此 语法 与 明确 插入 的 INSERT 语句 很 像 ， 它 们 都 有 SET 子 句 。 但 与 INSERT 不 同 的 是 ，UPDATE 
没有 “ 非 明确 ”语法 。 还 有 一 个 区 别 ， 就 是 UPDATE 没有 INT0 子 句 ， 表 名 是 紧 跟 着 UPDATE 
关键 字 的 。 

现在 来 看 看 UPDATE 的 一 个 例子 。 第 5 章 创建 了 一 个 birdwatchers 数据 库 ， 并 在 其 中 建 了 
一 个 humans 表 ， 以 保存 rookery 网 站 的 观 鸟 爱好 者 的 信息 。 后 来 我 们 在 该 表 中 录入 了 一 些 
人 的 信息 。 而 在 该 章 结尾 的 一 个 习题 中 ， 我 们 给 该 表 加 了 一 列 country_id， 以 保存 会 员 所 
在 国家 的 国家 代码 。 假 设 我 们 所 录入 的 那 少量 用 户 ， 他 们 都 住 在 美国 。 虽 然 我 们 可 以 设置 
country_id 默认 值 为 美国 〈 即 us), 但 其 实 我 们 希望 大 部 分 会 员 来 自 欧洲 。 所 以 ， 我 们 就 
先 将 该 表 的 country_id 全 部 设置 成 us。 执行 以 下 命令 : 


UPDATE birdwatchers.humans 
SET country id = 'us'; 
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此 语句 会 将 表 中 所 有 行 的 country_id 都 设 为 us。 此 前 它们 都 是 NULL。 而 即使 之 前 它们 有 
其 他 值 (其 他 国家 代码 ) ， 这 些 值 也 会 被 改 成 us。 这 将 造成 非常 大 的 影响 。 一 旦 执行 ， 基 
本 上 是 没有 方法 去 撤销 的 一 一 除非 你 的 表 是 InnoDB 的 ， 并 且 你 是 在 事务 中 执行 此 语句 。 
所 以 ， 使 用 UPDATE 要 小 心 。 你 应 加 上 WHERE 来 指定 要 更 新 的 行 ， 并 在 实际 更 新 之 前 先 做 测 
试 ， 测 试 方法 我 们 很 快 就 会 看 到 。 

注意 ， 上 例 还 指定 了 数据 库 名 称 ， 那 是 因为 在 前 面 章 节 中 ， 我 们 在 mysql 中 将 rookery 设 
为 了 默认 数据 库 。 而 本 章 所 有 示例 都 是 用 birdwatchers 的 ， 所 以 现在 用 USE 来 将 默认 数据 
库 改 为 它 吧 : 


USE birdwatchers; 


为 了 执行 本 章 接 下 来 的 示例 ， 你 最 好 先 到 MySQL 资源 站 (http://mysqlresources.com/files) 
下 载 rookery 和 pirdwatchers 的 dump 文件 。 它 们 所 含 的 数据 量 更 大 ， 更 适合 练习 。 


8.1.1 更 新 指定 行 


大 多 数 情况 下 ， 我 们 用 UPDATE 时 都 会 带 上 WHERE 子 句 ， 以 指定 哪些 行 会 按 SET 子 句 更 新 。 
UPDATE 的 WHERE 子 句 的 条 件 ， 与 SELECT 的 一 样 。 事 实 上 ， 正 因为 一 样 ， 所 以 你 可 以 先 用 
SELECT 来 测试 WHERE 的 条 件 ， 再 应 用 到 UPDATE 中 。 我 们 很 快 就 会 在 本 章 中 看 到 具体 做 法 。 
现在 先 来 看 看 如 何 只 更 新 一 行 。 


humans 表 中 有 一 行 是 一 位 叫 Rusty Osborne 的 女士 。 她 最 近 结 婚 了， 需要 将 姓 改 为 丈夫 的 
姓 一 一 Johnson。 我 们 可 以 用 UPDATE 来 处 理 。 首 先 ， 获取 她 那 条 记录 。 这 需要 根据 她 的 姓 
和 名 来 查询 ， 因 为 姓 Osborne 的 人 可 能 有 很 多 ， 而 全 名 为 Rusty Osborne 的 应 该 就 只 有 她 。 
在 mysql 中 输入 以 下 语句 : 

SELECT human_id, name_first, name_last 


FROM humans 
WHERE name_first = 'Rusty' 






















































































AND name_Last = '0sborne'; 

+---------- +------------ +----------- 十 
| human id | name_first | name_Last | 
+---------- +------------ +----------- + 
| 3 | Rusty | Osborne | 
+---------- +------------ +----------- 十 

















从 结果 可 以 看 出 ， 我 们 确实 只 有 一 个 Rusty Osborne， 她 的 human_id 为 3。 于 是 我 们 就 可 以 
在 UPDATE 中 用 这 个 ID ， 以 确保 只 更 新 这 一 行 。 输 入 以 下 语句 : 
UPDATE humans 


SET name_Last = "Johnson'" 
WHERE human_id = 3; 








SELECT human_id, name_first, name_last 
FROM humans 
WHERE human_id = 3; 





更 新 和 删除 数据 | 103 





+---------- +------------ +----------- + 
| human_id | name first | name_last | 
+---------- +------------ +----------- + 
| 3 | Rusty | Johnson | 
+---------- +------------ +----------- + 


成 功 了 。 使 用 UPDATE 是 很 简单 的 ， 尤 其 是 当 你 已 经 知道 了 所 要 更 新 的 行 的 键 值 时 。 现 
在 ， 假 设 有 两 个 已 婚 的 女 会 员 希 望 我 们 将 其 头衔 从 Mrs. 改 为 Ms. (此 信息 保存 在 枚 举 列 
formal_title 中 )。 经 过 SELECT 查找 ， 我 们 得 知 她 们 的 human_id 分 别 为 24 和 32。 于 是 ， 
可 以 使 用 以 下 UPDATE 语句 : 

UPDATE humans 


SET formal_title = 'Ms.' 
WHERE human_id IN(24, 32); 


当 想 要 更 新 的 行 数 多 于 一 行 时 ， 就 要 用 到 稍微 复杂 一 点 的 写法 了 。 不 过 ， 只 要 知道 键 值 
仍然 很 简单 。 就 像 本 例 ， 我 们 用 了 IN 运算 符 来 列 出 需要 匹配 的 多 个 human_id 号 。 


我 们 决定 与 时 俱 进 ， 除 了 修改 这 两 个 人 的 头衔 ， 还 打算 将 所 有 已 婚 女 会 员 的 头衔 都 改 成 
Ms.。 我 们 还 是 用 UPDATE， 但 这 次 要 修改 一 下 WHERE 子 句 。formal_title 为 Mrs. 的 女 会 员 
可 能 有 很 多 ， 如 果 全 部 手动 输入 她 们 的 human_id， 不 大 现实。 我 们 需要 更 简单 的 做 法 。 首 
先 ， 看 看 formal_title 列 是 怎样 的 : 

SHOW FULL COLUMNS 


FROM humans 
LIKE 'formal_title' \G 





























淡淡 尖 淡 火炎 淡淡 尖 炎炎 类 尖 火炎 炎炎 类 尖 炎 火炎 类 火炎 炎炎 a row 尖 尖 淡淡 尖 尖 淡淡 淡淡 类 尖 火炎 汪汪 炎炎 炎炎 类 类 炎炎 类 类 类 
Field: formal_title 
Type: enum('Mr.','Miss','Mrs.','Ms.') 
Collation: latin1_bin 
Null: YES 
Key: 
Default: NULL 
Extra: 
Privileges: select,insert,update,references 
Comment: 


该 列 的 枚 举 值 看 起 来 有 点 性 别 歧视 。 男 孩 和 男人 ， 不 管 年 龄 和 婚姻 状况 ， 都 只 有 一 种 称 
呼 ， 但 女性 却 有 三 种 。 而 且 ， 我 们 缺少 不 指明 性 别 的 称呼 ， 例 如 Dr.， 不 过 ， 我 们 还 是 先 
不 考虑 这 个 。 事 实 上 ， 我 们 也 可 以 完全 去 掉 这 列 以 消除 性 别 歧 视 ， 但 别 急 着 这 么 做 。 现 在 
先 改 表 结 构 ， 使 该 列 只 含 两 个 选项 : Mr. 和 Ms.。 而 在 改 表 结构 之 前 ， 我 们 得 先 修改 已 填 
充 的 值 。 为 了 达到 目的 ， 要 用 UPDATE 语句 : 

UPDATE humans 


SET formal_title = 'Ms.' 
WHERE formal_title IN('Miss','Mrs.'); 


把 现存 记录 的 formal_title 都 改 成 Mr. 或 Ms. 之后， 就 可 以 更 改 该 列 的 设置 ， 去 掉 其 他 选 
项 。 这 将 用 到 第 4 章 讲 过 的 ALTER TABLE 语句 。 输 入 以 下 命令 执行 更 改 : 














A 
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ALTER TABLE humans 
CHANGE COLUMN formal_title formal_title ENUM('Mr.','Ms.'); 


Query OK, 62 rows affected (0.13 sec) 

Records: 62 Duplicates: 0 Warnings: 0 
从 结果 中 的 返回 信息 可 以 看 到 ， 更 改 顺 利 。 不 过 ， 如 果 你 在 改 表 结构 之 前 ， 有 一 行 数 据 忘 
了 修改 (例如 有 个 人 的 Miss 没 改 成 Ms.) ， 那 么 返回 信息 中 的 Warnings 就 会 是 1。 出 现 这 
种 情况 时 ， 可 以 使 用 SHOW WARNINGS 来 查看 该 警告 : 


SHOWN WARNINGS \G 





























类 淡淡 火 火 火炎 炎炎 类 类 炎炎 火炎 火炎 类 大 类 大 大火 火 火 火炎 二 row 类 淡淡 火 火 火炎 类 尖 炎炎 淡淡 火 火 火 火炎 大 炎炎 火炎 火炎 炎炎 


Level: Warning 
Code: 1265 
Message: Data truncated for column 'formal_ title' at row 44 


此 警告 的 意思 是 ，MySQL 清除 了 第 和 4 行 的 formal_title 列 的 值 。 于 是 我 们 还 得 再 用 
UPDATE 来 修复 该 行 的 头衔 ， 并 且 新 头衔 也 要 符合 新 的 枚 举 值 。 所 以 ， 多 数 情况 下 ， 改 表 结 
构 前 ， 最 好 先 更 新 数据 。 


不 过 也 有 反 过 来 的 时 候 : 在 修改 大 批 数 据 时 ， 要 在 更 新 前 先 改 表 结 构 。 例 如 ， 假 设 我 们 想 
将 formal_title 的 枚 举 值 改 成 Mr 和 Ms (没有 句点 )。 这 种 情况 下 ， 可 以 先 给 它 的 枚 举 列 
表 加 上 这 两 个 新 选项 ， 然 后 再 将 数据 改 成 新 值 。 而 UPDATE 语句 的 WHERE 子 句 也 要 修改 。 因 
为 新 值 与 旧 值 存在 这 样 的 对 应 关系 : 新 值 是 旧 值 的 前 两 个 字符 ， 所 以 可 以 在 UPDATE 中 使 用 
截取 函数 来 做 更 新 。 大 概 如 下 : 

ALTER TABLE humans 

CHANGE COLUMN formal_title formal_title ENUM('Mr.','Ms.','Mr','Ms'); 
























































UPDATE humans 
SET formal_title = SUBSTRING(formal_title, 1, 2); 


ALTER TABLE humans 
CHANGE COLUMN formal_title formal_title ENUM('Mr','Ms'); 


第 一 个 ALTER TABLE 语句 只 是 给 formal_title 加 了 两 个 不 带 名 点 的 新 选项 ， 并 没有 去 除 原 
选项 ， 这 是 因为 现存 的 数据 在 使 用 这 两 个 旧 值 。 最 后 的 ALTER TABLE 才 是 去 除 原 选 项 。 这 
两 个 语句 没什么 特别 。 而 第 二 个 语句 的 UPDATE 就 有 趣 多 了 。 

在 SET 子 句 中 ， 我 们 将 formal_title 的 值 设 为 了 当前 值 的 子 串 ， 其 中 用 到 SUBSTRING() 国 
数 来 抽取 文本 内 容 。 在 其 括号 中 ， 我 们 首先 给 出 了 子 串 的 来 源 (formal_title)， 然 后 是 子 
串 的 起 始 位 置 : 1， 表 示 原 字符 串 的 第 一 个 字符 ， 接 着， 指定 需要 抽取 的 字符 数量 : 2。 所 
以 ，SUBSTRING() 遇 到 Mr. 时 ， 会 抽出 Mr， 而 遇 到 Ms. 时 ， 会 抽出 Ms。 


注意 ， 函 数 不 会 改变 原 数据 。SUBSTRING() 只 是 返回 子 串 。 若 想 落 实 修改 ， 还 需要 SET 
formal_title = 子 句 。 这 样 才 能 将 SUBSTRING() 得 出 的 值 应 用 到 formal_title 中 。 还 有 ， 
如 果 需 要 的 话 ， 甚 至 可 以 对 一 列 进行 SUBSTRING() 运算 ， 然 后 将 其 返回 值 用 于 更 新 另 一 列 。 


本 章 会 用 到 不 少 有 益 于 UPDATE 的 字符 串 函 数 。 想 了 解 更 多 的 字符 串 函 数 ， 详 见 第 10 章 。 









































更 新 和 删除 数据 | 105 





8.1.2 按 行 数 更 新 


本 章 开 头 曾 经 提 到 ，UPDATE 语句 很 强大 ， 它 能 快速 更 改 大 量 数据 。 所 以 ， 儿 乎 所 有 时 候 ， 
你 都 应 该 给 它 带 上 WHERE 子 句 ， 以 便 用 条 件 限制 它 所 能 更 新 的 行 。 有 了 时 你 可 能 还 想 用 行 数 
来 限制 更 新 ， 可 以 用 LIMIT。 它 在 UPDATE 中 的 作用 与 在 SELECT 中 一 样 ， 不 过 目的 不 一 样 。 
而 为 什么 你 会 在 UPDATE 中 用 LIMIT， 以 及 如 何 使 用 它 ， 下 面 我 们 就 用 例子 来 说 明 。 
假设 我 们 决定 每 月 挑选 两 个 会 员 来 给 他 们 一 些 奖 励 ， 以 吸引 人 们 加 入 我 们 的 网 站 。 奖 励 可 
能 是 一 本 野外 鸟 类 摄影 图 及 ， 可 能 是 一 支 上 面 有 Rookery 字样 的 钢笔 ， 也 可 能 是 一 个 有 鸟 
只 图 案 的 水 瓶 。 再 假设 每 个 会 员 都 有 且 只 有 一 次 机 会 获奖 。 为 了 记录 中 奖 者 ， 我 们 得 创建 
一 个 表 来 保存 每 个 中 奖 者 的 姓名 和 中 奖 时 间 ， 以 及 具体 奖品 和 发 奖 时 间 。 用 以 下 的 CREATE 
TABLE 语句 来 建 这 个 表 : 

CREATE TABLE prize_ winners 

(winner_id INT AUTO_INCREMENT PRIMARY KEY, 

human_id INT， 

winner_date DATE, 


prize_chosen VARCHAR(255), 
prize_sent DATE); 


此 语句 将 创建 一 个 名 为 prize_winners 的 表 ， 其 中 会 有 五 列 : 第 一 列 (winner_id) 是 每 行 
的 标识 号 ， 第 二 列 (human_id) 用 于 关联 humans 表 ; 第 三 列 (winner_date) 用 于 保存 抽 
奖 时 间 ; 接着 的 prize_chosen 列 保存 所 选 的 奖品 ， 最 后 的 prize_sent 列 保存 奖品 发 出 的 
时 间 。 






































此 表 的 两 个 ID 可 能 令 人 困惑 。winner_id 用 于 标识 表 中 每 条 记录 ， 可 以 用 它 
来 查 出 每 次 抽奖 的 奖品 和 日 期 。 而 human_id 则 是 用 于 从 humans 表 查 询 每 个 
中 奖 者 的 信息 。 因 为 每 个 人 只 有 一 次 中 奖 机 会 ， 所 以 你 可 能 会 觉得 没 必 要 用 
两 个 ID。 但 回想 之 前 我 们 在 birds、bird_families 和 bird_orders 之 间 进 行 
表 连 接 的 方式 ， 就 会 发 现 ， 给 每 个 表 都 指定 一 个 专属 的 ID 列 ， 是 一 种 健壮 
的 设计 。 




















prize_chosen 列 也 可 以 设 为 枚 举 类 型 ， 但 未 来 奖品 可 能 有 更 多 选择 ， 最 终 我 们 可 能 还 得 再 
创建 一 个 表 来 保存 奖品 信息 ， 然 后 将 prize_chosen 改 成 外 键 ， 参 考 奖 品 表 。 所 以 我 们 暂时 
就 将 它 设 为 足够 长 的 变 长 字符 串 类 型 吧 。 
因为 每 个 会 员 都 有 一 次 中 奖 机 会 ， 所 以 我 们 可 以 先 将 所 有 会 员 都 导入 prize_winners。 不 
这 样 做 的 话 ， 也 可 以 延迟 到 抽奖 时 才 把 中 奖 者 录入 。 这 对 于 数据 维护 来 说 应 该 更 好 ， 但 
因为 INSERT...SELECT 很 便捷 ， 所 以 我 们 就 直接 INSERT...SELECT 吧 (6.3.2 节 介 绍 过 这 
种 语法 ) : 

INSERT INTO prize_winners 

(human_id) 


SELECT human_id 
FROM humans; 


此 语句 将 humans 表 的 每 个 会 员 都 插入 prize_winners 了 。 我 们 只 填写 human_id 列 ， 因 为 现 





eng 























在 还 没 抽奖 。 另 外 ， 因 为 winner_id 是 AUTO_INCREMENT 的 ， 所 以 它 被 自动 填写 了 一 系列 递 
增 且 每 一 行 都 不 同 的 值 。winner_id 的 值 不 应 与 human_id 一 样 ， 因 为 human_id 另 有 用 途 。 
除了 这 两 列 ， 其 他 列 暂时 都 是 NULL。 有 人 获奖 时 ， 我 们 才 会 去 更 新 这 些 列 。 


既然 已 经 建 好 了 中 奖 表 ， 那 么 我 们 就 开始 抽奖 吧 。 


8.1.3 排序 后 再 按 行 数 更 新 
在 前 一 节 中 ， 我 们 说 要 通过 为 会 员 发 放 奖 品 来 吸引 新 用 户 加 入 网 站 ， 并 维持 与 老 会 员 的 关 
系 。 我 们 会 让 MySQL 每 个 月 随机 抽 选 会 员 ， 使 新 老 会 员 都 有 同等 的 获奖 机 会 。 有 具体 做 法 
就 是 用 UPDATE 语句 ， 并 带 上 ORDER BY 子 句 和 RAND() 畏 数 。 此 国 数 在 这 里 的 作用 是 ， 给 符 
合 WHERE 条 件 的 每 一 行 分 配 一 个 随机 的 浮 点 数 。 然 后 ， 因 为 我 们 把 它 加 入 ORDER BY 了 ， 所 
以 结果 集 就 按照 这 个 随机 数 来 排序 了 。 如 果 再 在 后 面 加 上 LIMIT 2， 那 么 就 可 以 每 次 都 只 
返回 两 个 获奖 者 : 

UPDATE prize winners 

SET winner_date = CURDATE() 

WHERE winner_date IS NULL 


ORDER BY RAND() 
LIMIT 2; 


不 过 RAND() 是 有 缺陷 的 ， 它 其 实 并 不 是 很 随机 ， 有 了 时 会 返回 相同 数值 。 所 以 你 得 考虑 清楚 
它 是 否 真 的 适用 于 你 的 需求 。 


我 们 从 底 往 上 分 析 这 个 语句 吧 。ORDER BY 在 这 里 有 点 讽刺 ， 因 为 它 按 RAND() 所 造 出 的 乱 序 
来 排序 。 而 LIMIT 则 将 结果 集 限制 为 两 行 。 因此， 人 人 都 有 平等 机 会 成 为 两 个 中 奖 者 之 一 。 


不 过 ， 这 还 不 足以 保证 查 出 来 的 两 个 人 是 未 中 过 奖 的 。 我 们 有 可 能 因为 乱 序 而 在 不 同 的 
月 份 抽 到 相同 的 人 人。 所以， 要 UPDATE 的 是 用 WHERE 来 选 出 winner_date 为 NULL 的 行 ， 
即 那些 没 中 过 奖 的 人 。 最 后 ， 在 SET 中 ， 将 winner_date 设 为 当前 日 期 。 这 里 所 用 到 的 
CURDATE() ， 会 在 第 11 章 介 绍 。 


此 外 ， 这 个 语句 还 有 些 不 太 明 显 的 问题 。 首 先 ， 在 ORDER BY 中 使 用 RAND() 可 能 有 性 能 问 
题 。 如 果 你 的 表 不 大 ， 那 可 能 察觉 不 到 。 但 如 果 表 很 大 ， 服 务 器 又 很 繁忙 ， 那 就 可 能 要 运 
行 很 和 了。 所 以 ， 在 ORDER BY 中 用 RAND() 时 ， 你 得 考虑 表 的 大 小 和 运行 环境 。 其次， 在 
“MySQL 复制 ”的 环境 下 ， 同 时 使 用 ORDER BY 和 LIMIT， 也 可 能 导致 问题 ， 除 非 你 的 复制 
是 基于 行 的 。“MySQL 复制 ”是 一 套 主 从 服务 器 配置 ， 它 允许 你 把 主 服 务 器 的 数据 复制 到 
从 服务 器 上 。 它 是 一 个 高 级 话题 ， 但 因为 在 UPDATE 中 同时 使 用 ORDER BY 和 LIMIT 可 能 导 
致 一 些 问题 ， 所 以 我 还 是 想 说 说 。 它 可 能 导致 的 问题 就 是 会 出 现 以 下 警告 : 
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Level: Warning 
Code: 1592 
Message: Statement is not safe to Log in statement format. 


如 果 你 没有 在 用 “MySQL 复制 *， 那 么 可 以 忽略 这 个 警告 。 而 如 果 在 用 ， 那 么 就 有 可 能 
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致 从 库 的 数据 与 主 库 的 (或 其 他 从 库 的 ) 不 一 致 一 一 尤其 是 使 用 了 RAND() (因为 语句 应 用 
到 从 库 时 所 取 的 随机 数 不 同 了 )。 不 过 ， 因 为 你 还 处 在 初学 阶段 ， 所 以 可 以 暂时 忽略 这 个 
东西 ， 并 且 安 全 地 使 用 子 句 和 这 个 函数 。 我 只 是 希望 你 了 解 这 些 潜 在 的 问题 ， 并 让 你 知道 
MySQL 的 相关 知识 是 多 么 博大 精深 。 


8.1.4 同时 更 新 多 个 表 


本 章 直到 现在 ， 我 们 试 过 用 原 表 中 的 数据 来 更 新 表 ， 但 其 实 取 其 他 表 的 数据 来 做 更 新 也 是 
可 以 的 。 另 外 ， 我 们 使 用 的 UPDATE 都 是 一 次 只 更 新 一 个 表 ， 但 其 实 一 次 更 新 多 个 表 也 是 可 
以 的 。 接 下 来 我 们 就 看 看 为 何以 及 如 何 做 到 这 两 点 。 


假设 发 了 一 段 时 间 的 奖品 后 ， 我 们 决定 加 大 力度 ， 吸 引 英 国人 加 入 并 留 在 我 们 的 网 站 。 
于 是 ， 我 们 打算 每 次 发 四 个 奖品 ， 其 中 两 个 发 给 来 自 英 国 的 会 员 ， 另 外 两 个 发 给 英国 以 
外 的 会 员 。 我 们 会 全 站 告知 这 一 决定 ， 甚 至 允许 拿 过 奖 的 英国 用 户 再 拿 一 次 。 为 了 做 到 
这 一 点 ， 我 们 得 先 按 humans 的 country_id 来 重 置 prize_winners 的 数据 。 下 面 就 是 我 们 
的 做 法 : 
UPDATE prize_ winners, humans 
SET winner_date = NULL, 
prize_chosen = NULL， 
prize_sent = NULL 


WHERE country_id = "uk’ 
AND prize_ winners.human_id = humans.human_id; 


此 语句 先 从 一 个 表 中 查找 符合 条 件 的 行 ， 然 后 将 这 些 行 与 另 一 个 表 的 行进 行 连接 ， 最 后 更 
新 另 一 个 表 的 那些 行 。 首 先 ， 列 出 两 个 表 ， 并 用 喜 号 分 隔 。 接 着 ， 使 用 SET 子 句 ， 将 获奖 
相关 的 列 设 为 NULL。 最 后 在 WHERE 子 句 中 ， 给 出 筛选 humans 表 的 country_id 条 件 : 含有 
uk 这 个 值 ， 并 且 两 个 表 按 human_id 连接 。 

重 置 完 英国 用 户 的 获奖 记录 后 ， 就 可 以 开始 这 个 月 的 抽奖 了 。 找 回 之 前 那个 随机 挑选 用 户 
的 UPDATE 语句 ， 但 这 次 将 它 改 成 含有 humans 和 prize_winners: 































































































UPDATE prize_winners, humans 

SET winner_date = CURDATE() 

WHERE winner_date IS NULL 

AND country_id = "uk' 

AND prize_winners.human_id = humans.human_id 
ORDER BY RAND() 

LIMIT 2; 


ERROR 1221 (HY000): Incorrect usage of UPDATE and ORDER BY 


你 可 能 认为 这 么 写 是 可 以 的 ,但 其 实 不 行 。 语 句 执行 失败 ， 并 返回 了 一 个 报错 信息 。 那 
是 因为 ， 在 MySQL 使 用 UPDATE 的 多 表 语 法 时 ， 不 能 带 有 ORDER BY 或 LIMIT 但 在 
UPDATE 单 表 时 就 可 以 。 这 令 人 诅 形 ， 不 过 我 们 还 是 有 办 法 解决 它 。 因 为 UPDATE 单 表 可 以 
用 ORDER BY、RAND() 和 LIMIT， 所 以 我 们 可 以 先 在 子 查询 ( 即 包含 在 查询 语句 中 的 另 一 个 
查询 ) 中 ， 从 humans 表 随 机 选 出 得 奖 者 ， 然 后 按 他 们 来 更 新 prize_winners 表 。 下 面 就 
来 看 看 实现 方法 : 
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UPDATE prize winners 
SET winner_date = CURDATE() 
WHERE winner_date IS NULL 
AND human_id IN 
(SELECT human_id 
FROM humans 
WHERE Country_ id = "uk’ 
ORDER BY RAND()) 
LIMIT 2; 


这 好 像 很 复杂 ， 但 分 解 开 来 看 ， 就 会 发 现 其 实 并 不 难 。 首 先 看 看 那个 内 嵌 的 查询 ， 即 被 括 
号 包围 的 那个 SELECT 语句 。 它 的 作用 是 查询 humans 表 里 所 有 country_id 为 uk 的 会 员 ， 并 
以 乱 序 返 回 结果 集 。 注 意 ， 我 们 查找 的 是 所 有 英国 用 户 ， 而 且 并 不 区 分 是 否 拿 过 奖 。 这 是 
因为 内 艇 的 查询 语句 不 能 查 UPDATE 语句 所 作用 的 表 。 所 以 ， 查 询 条 件 需 要 分 开 : 只 更 新 
winner_date 为 NULL 的 语句 ， 要 放 在 UPDATE 的 WHERE 子 句 中 。 整 个 语句 是 针对 英国 用 户 
的 。 如 果 是 查找 英国 以 外 的 用 户 ， 很 简单 ， 只 需 将 子 查 询 中 的 运算 符 改 成 != 即 可 。 


而 在 UPDATE 中 ， 我 们 用 IN 来 限定 prize_winners 的 human_id 必须 符合 子 查询 ， 才 会 被 更 
新 。 最 后 的 LIMIT 指定 只 更 新 两 行 。 注 意 ， 它 属于 UPDATE， 而 不 属于 子 查 询 ( 即 SELECT ) 。 


因为 子 查询 与 UPDATE 是 分 开 的 ， 它 被 首先 执行 ， 所 以 在 里 面 用 ORDER BY 是 没 问 题 的 。 而 
LIMIT 所 在 的 UPDATE 并 没有 使 用 多 表 更 新 的 语法 ， 所 以 也 能 正常 运行 。 

这 样 写 可 能 看 起 来 很 麻烦 ， 但 它 解决 了 问题 。 如 有 果 有 什么 方法 你 觉得 可 行 ， 但 实际 却 不 
行 ， 可 以 试 试用 子 查询 来 做 。 第 9 章 将 详细 介绍 子 查 询 。 


8.1.5 ”处理 重复 


第 6 章 已 经 详细 介绍 过 INSERT 语句 。 我 们 见 过 它 的 各 种 语法 和 有 趣 的 使 用 方式 ， 包 括 
INSERT...SELECT， 即 INSERT 和 SELECT 合 在 一 起 使 用 。 其 实 ， 还 有 一 种 组 合 方式 ， 可 用 于 
更 新 行 ， 那 就 是 INSERT. . .ON DUPLICATE KEY UPDATE。 


插入 多 行 数据 时 ， 你 可 能 会 不 小 心 录 入 重复 的 数据 : 即 本 应 各 有 不 同 的 行 ， 出 现 了 相同 
值 。 如 果 你 用 的 是 INSERT， 可 以 加 上 IGNORE 标识 ， 以 指示 数据 库 忽略 重复 的 行 ， 不 插入 
它们 。 而 如 果 用 的 是 REPLACE，MySQL 就 会 更 新 已 存在 的 行 ， 或 者 说 把 它们 删 掉 ， 保 留 
新 行 。 除 了 以 上 做 法 之 外 ， 你 可 能 会 想 保留 原本 的 行 ， 但 给 它们 做 上 标记 。 那 么 ， 可 以 用 
INSERT. . .ON DUPLICATE KEY UPDATE。 看 看 下 面 的 例子 ， 你 就 会 明白 我 的 意思 。 


假设 存在 另 一 个 观 岛 网 站 ， 它 与 我 们 的 网 站 类 似 ， 但 名 字 叫 作 Better Birders。 不 过 很 少 
人 访问 那个 网 站 ， 于 是 它 的 站 长 想 把 它 关 掉 ， 并 且 他 告诉 我 们 ， 如 果 我 们 吸纳 那个 网 站 
的 会 员 ， 他 就 让 该 站 重 定向 到 我 们 这 边 。 我 们 同意 了 。 接 着 ， 他 给 了 我 们 一 个 含有 该 站 
会 员 姓 名 和 电子 邮件 地 址 的 文本 文件 。 有 多 种 方法 导入 这 个 文件 ， 第 15 章 将 介绍 其 中 一 
些 方法 。 不 过 ， 因 为 文件 中 有 些 人 已 经 在 我 们 的 网 站 上 注册 过 了 ， 所 以 我 们 不 想 重复 导 
入 。 然 而 ， 我 们 又 想 把 这 些 会 员 标记 出 来 ， 以 备 日 后 需要 。 可 以 尝试 使 用 INSERT.. .ON 
DUPLICATE KEY UPDATE。 首 先 ， 用 ALTER TABLE 加 一 列 ， 用 于 记录 基 条 会 员 信息 是 否 来 自 
Better Birders 网 站 : 
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ALTER TABLE humans 
ADD COLUMN better_birders_site TINYINT DEFAULT 0; 





此 语句 增加 了 名 为 better_birders_site 的 一 列 ， 并 设 其 默认 值 为 0。 对 于 来 自 Better 
Birders 的 记录 ， 甚 值 会 被 设 为 1。 而 如 果 是 既 在 Better Birders， 又 在 我 们 这 边 ， 则 记 为 2。 
因为 人 是 有 可 能 同名 的 ， 所 以 我 们 用 电子 邮件 地 址 来 区 分 。 因 为 在 humans 表 中 ， 我 们 设 
置 过 email_address 为 UNIQUE， 所 以 INSERT.. .ON DUPLICATE KEY UPDATE 就 能 根据 email_ 
address 来 进行 更 新 操作 了 。 下 面 就 动手 输入 几 个 会 员 试 试 吧 






























































INSERT INTO humans 

(formal_title, name_first, name_last, email _address, better_birders_site) 

VALUES( 'Mr','Barry','Pilson', 'barry@gomail.com', 1), 
('Ms','Lexi','Hollar', 'alexandra@mysqlresources.com', 1), 
('Mr','Ricky','Adams', 'ricky@gomail.com', 1) 

ON DUPLICATE KEY 

UPDATE better_birders_ site = 2; 


因为 加 上 了 ON DUPLICATE KEY， 所 以 如 果 发 现 有 重复 的 电子 邮件 地 址 ，better_birders_ 
site 就 会 被 更 新 为 2。 而 没有 发 现 重复 的 那些 行 ， 就 会 记 为 1。 这 正 符合 我 们 的 要 求 。 
接着 ， 将 这 些 新 会 员 插 入 prize_winners 表 。 我 们 会 跟 之 前 一 样 ， 用 INSERT.. .SELECT 语 


句 ， 








不 过 只 选 出 better_birders_site 为 1 的 行 来 插入 : 


INSERT INTO prize_winners 
(human_id) 

SELECT human_id 

FROM humans 

WHERE better_birders_ site = 1; 


尽管 以 上 两 个 语句 能 按 电子 邮件 地 址 来 区 分 会 员 是 否 是 同一 个 人 ， 但 事实 上 ， 同 一 个 人 也 











可 以 用 不 同 的 电子 邮件 地 址 来 广 册 两 个 网 站 。 甚 至 ， 还 可 以 用 不 同 的 电子 邮件 地 址 在 我 们 
的 网 站 上 注册 多 次 。 为 了 检查 是 否 有 这 种 情况 并 标识 出 来 ， 我 们 先 做 些 准 备 工作 : 


第 一 








ALTER TABLE humans 
ADD COLUMN possible _ duplicate TINYINT DEFAULT 0; 


CREATE TEMPORARY TABLE possible_ duplicates 
(name_1 varchar(25)，name_2 varchar(25)); 


句 是 给 humans 表 增 加 一 列 ， 以 标记 “可 能 重复 注册 *。 第 二 句 则 是 建 了 一 个 临时 表 。 








临时 表 只 能 被 同一 MySQL 客户 端 访问 ， 并 且 ， 在 退出 客户 端 时 ， 临 时 表 就 会 被 自动 删 掉 。 
因为 在 检查 重复 的 过 程 中 ， 我 们 不 能 对 原 表 进行 更 新 ， 所 以 需要 在 临时 表 里 做 标记 。 先 用 
INSERT. . .SELECT 查找 : 








INSERT INTO possible_ duplicates 
SELECT name_first, name_last 
FROM 
(SELECT name_first, name_last, COUNT(*) AS nbr_entries 
FROM humans 
GROUP BY name_first, name_last) AS derived_table 
WHERE nbr_entries > 1; 





此 语句 使 用 了 一 个 子 查询 ， 该 子 查 询 根据 GROUP BY 子 句 统计 出 每 个 名 字 及 该 名 字 的 计数 。 
虽然 7.7 节 已 经 讲 过 GROUP BY 和 COUNT()， 但 这 里 我 们 还 是 再 走 一 遍 。 此 子 查询 查 出 name_ 
first 和 name_last， 并 对 它们 进行 分 组 ， 以 使 相同 的 姓名 被 归 在 一 组 。 于 是 ， 我 们 就 可 以 
对 每 一 组 进行 计数 了 。 我 们 还 给 COUNT(*) 分 配 了 一 个 别名 (nbr_entries)， 以 便 在 语句 的 
其 他 位 置 能 引用 该 计数 。 

然后 再 来 看 主 SQL 语句 。 它 用 WHERE 子 句 筛 选 出 子 查 询 中 姓名 重复 的 行 ( 即 nbr_entries 
大 于 1 的 行 )。 这 些 就 是 重复 的 姓名 。 于 是 ， 整 个 语句 的 意思 就 是 ， 在 humans 表 中 找 出 重 
复 的 姓名 ， 然 后 将 其 输入 临时 表 ， 并 且 每 个 姓名 在 临时 表 中 只 占 一 行 。 


现在 我 们 在 临时 表 中 已 经 知道 了 可 能 重复 注册 的 人 ， 接 着 就 可 以 更 新 humans 表 ， 把 他 们 标 
识 出 来 了 : 

UPDATE humans, possible duplicates 

SET possible duplicate = 1 

WHERE name_first = name_1 

AND name_last = name_2; 


此 语句 将 把 humans 表 中 符合 possible_duplicates 的 行 更 新 成 possible_duplicate = 1。 
标记 好 之 后 ， 我 们 就 可 以 给 这 些 用 户 发 邮件 ， 告 诉 他 们 有 重复 的 姓名 ， 问 他 们 是 否 重复 
注册 。 如 果 有 人 回复 说 是 ， 那 么 就 可 以 对 该 用 户 的 信息 进行 一 些 整 合 〈 例 如 ， 增 加 一 列 ， 
以 存放 该 用 户 的 第 二 个 电子 邮件 地 址 ) ， 并 删 掉 重复 的 行 。 而 那个 临时 表 会 自然 地 在 退出 
MySQL 客户 端 时 被 删 掉 。 


8.2 删除 数据 


大 部 分 数据 库 都 需要 有 删除 数据 的 操作 。 该 操作 可 以 通过 DELETE 语句 来 完成 。 而 之 前 我 
们 已 经 多 次 提 过 ，MySQL 没有 UNDELETE 或 UND0 命令 供 你 恢复 被 删 数 据 。 恢 复数 据 只 能 
通过 备份 ， 而 且 你 也 应 该 做 好 备份 ， 不 过 恢复 备份 是 很 缓慢 、 很 麻烦 的 。 如 有 果 你 用 的 是 
InnoDB， 那 么 可 以 用 事务 来 集合 SQL 语句 ， 并 对 事务 中 执行 过 的 删除 操作 进行 回 深 。 但 
如 有 果 在 事务 中 你 把 删除 都 提交 了 ， 那 是 无 法 回 滚 的 ， 你 就 只 能 找 备份 或 其 他 麻烦 的 方法 来 
恢复 了 。 因 此 ， 删 除数 据 要 谨慎 。 


DELETE 语句 与 SELECT 语句 相似 ， 可 以 根据 WHERE 子 句 来 指定 要 删除 的 行 。 而 且 ， 你 也 应 该 
总 是 加 上 WHERE 子 句 ， 除 非 你 真 的 想 把 表 中 的 所 有 行 都 删 掉 。 另 外 ， 你 可 以 带 上 ORDER BY 
子 句 ， 以 指定 删除 的 顺序 ， 也 可 以 带 上 LIMIT 子 句 ， 按 行 数 来 限定 删除 量 。 它 的 基本 语法 
如 下 : 

DELETE FROM table 

[WHERE condition] 


[ORDER BY column] 
[LIMIT row_count]; 


WHERE、ORDER BY 和 LIMIT 都 是 用 方 括号 包围 的 ， 代 表 它 们 都 是 可 选 的 。 除 此 之 外 ， 还 有 其 


他 选项 可 实现 一 次 删除 多 个 表 的 数据 ， 或 根据 其 他 表 删 除 某 个 表 的 数据 。 不 过 ， 我 们 现在 
先 看 最 简单 的 这 种 。 
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假设 在 发 邮件 给 那些 疑似 重复 注册 的 用 户 之 后 ， 有 人 回复 承认 了 。 并 且 ， 这 个 人 是 来 自 俄 
罗斯 的 Elena Bokova， 她 希望 我 们 帮 她 删 掉 那 个 旧 的 雅虎 邮件 地 址 。 那 么 ， 我 们 只 需 执行 
下 面 这 条 语句 〈 但 实际 上 我 们 不 执行 它 ) : 

DELETE FROM humans 

WHERE name_first = "ELena' 


AND name_Last = 'Bokova' 
AND emaiL_address LIKE '%yahoo.com'; 


此 SQL 语句 会 删 掉 所 有 符合 WHERE 中 条 件 的 行 。 注 意 ， 为 了 找到 用 户 所 说 的 那个 电子 邮件 
地 址 ， 我 们 使 用 了 LIKE 和 %， 以 匹配 所 有 以 yahoo.com 结尾 的 值 。 


这 个 语句 是 可 行 的 ， 不 过 ， 我 们 还 得 删 掉 prize_winners 中 相关 的 记录 。 所 以 其 实 我 们 应 
该 在 删除 humans 表 中 相应 行 之 前 ， 先 把 human_id 记 下 来 。 这 就 是 为 什么 我 刚才 说 不 要 执 
行 该 语句 。 但 是 ， 这 样 先 用 一 条 语句 获取 human_id， 然 后 用 另 一 条 语句 删除 humans 中 的 
记录 ， 最 后 再 用 一 条 语句 删除 prize_winners 中 的 记录 ， 是 很 繁琐 的 。 更 好 的 做 法 是 ， 在 
DELETE 中 包含 这 两 个 表 ， 一 次 就 删除 两 个 表 的 相关 记录 。 有 具体 怎么 做 ， 下 一 节 会 介绍 。 


一 次 删除 多 个 表 的 数据 

一 个 表 的 数据 依赖 另 一 个 表 的 数据 是 很 常见 的 。 如 果 用 DELETE 从 一 个 表 中 删 掉 了 一 行 被 另 
一 个 表 参 考 的 数据 ， 那 么 就 会 产生 孤立 数据 。 可 以 再 写 一 条 DELETE 语句 来 把 另 一 个 表 的 相 
关 行 给 删 掉 ， 但 更 好 的 做 法 是 在 同一 条 语句 中 删除 两 个 表 中 的 行 。 尤 其 是 当 要 删 的 行 很 多 
时 ， 更 应 该 采用 后 者 。 


DELETE 的 多 表 删 除 语法 如 下 : 


DELETE FROM table[，table] 
USING table[, . . . ] 
[WHERE condition]; 


你 需要 在 FROM 子 句 中 ， 以 逗号 分 隔 的 方式 ， 列 出 相关 的 表 。 然 后 ， 在 USING 子 句 中 ， 声 明 
这 些 表 是 如 何 连 接 的 例如 ， 用 human_id 连接 )。 最 后 的 WHERE 子 句 是 可 选 的 。 和 UPDATE 
的 多 行 更 新 一 样 ， 有 多 个 表 时 ， 不 能 使 用 ORDER BY 和 LIMIT。 这 种 语法 是 挺 环 手 的 ， 光 看 
上 面 的 模板 可 能 不 太 明 显 ， 需 要 用 例子 来 说 明 。 


上 一 市 的 最 后 一 个 例子 讲 到 删除 两 个 表 中 相关 的 行 。 具 体 来 说 ， 就 是 把 使 用 雅虎 邮箱 的 用 
户 Elena Bokova 从 humans 和 prize_winners 两 个 表 中 删除 。 想 要 用 一 条 语句 完成 此 任务 ， 
可 以 这 样 做 : 

DELETE FROM humans, prize _ winners 

USING humans JOIN prize winners 

WHERE name_first = "ELena' 

AND name_Last = 'Bokova' 


AND email_address LIKE '%yahoo.com' 
AND humans.human_id = prize winners.human_id; 


此 DELETE 与 其 他 数据 操作 的 语句 很 像 (如 SELECT、UPDATE)。 不 过 ， 它 却 有 一 点 出 平 意料 ， 
甚至 令 人 困惑 的 地 方 。 我 们 在 FROM 子 句 列 出 想 删 的 表 后 ， 又 在 USING 子 句 中 再 次 列 出 它 
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们 ， 并 声明 它们 的 连接 方式 。 很 明显 ，FROM 是 用 于 说 明 要 删 哪些 表 的 。 如 果 没 有 在 FROM 
中 包含 prize_winners， 那 么 该 表 中 相关 的 行将 不 会 被 删除 。 


除了 以 上 这 些 ，DELETE 还 有 其 他 选项 和 写法 。 不 过 ， 就 现 阶段 来 说 ， 本 章 所 介绍 的 内 容 已 
经 能 够 帮助 你 完成 绝 大 部 分 的 MySQL 和 MariaDB 的 开发 和 管理 任务 了 。 


8.3 ”小结 


UPDATE 和 DELETE 适用 于 修改 表 中 的 数据 。 而 且 ， 对 于 管理 MySQL 和 MariaDB 来 说 ， 它 
们 是 必 不 可 少 的 。 它 们 的 写法 多 样 ， 能 助 你 轻松 修改 数据 。 你 也 可 以 使 用 它们 构建 出 复杂 
的 SQL 语句 ， 精 确 地 更 新 或 删除 指定 的 数据 。 不 过 ， 它 们 有 时 令 人 迷惑 。 所 以 ， 你 应 时 刻 
保持 警觉 ， 并 努力 掌握 好 它们 的 用 法 。 


如 果 你 在 使 用 UPDATE 和 DELETE 时 提心吊胆 ， 那 就 对 了 。 一 条 UPDATE 语句 可 以 修改 表 中 所 
有 的 行 ， 一 条 DELETE 语句 就 可 以 删除 表 中 所 有 的 行 。 对 于 大 型 数据 库 来 说 ， 那 就 可 能 

致 数 千 行 数据 在 一 秒 钟 之 内 被 更 改 或 删除 。 所 以 ， 我 们 才 需 要 做 好 备份 。 无 论 何 时 ， 在 使 
用 这 两 条 语句 之 前 ， 都 应 该 先 检查 清楚 它们 是 否 无 误 。 尤 其 是 对 于 初学 者 来 说 ， 最 好 先 用 
CREATE TABLE.. .SELECT 把 表 复 制 一 份 ， 再 做 修改 或 删除 。5.2 节 介 绍 过 这 种 用 法 。 使 用 这 
种 方法 ， 即 使 改 错 了 数据 ， 也 还 能 用 备份 出 来 的 数据 恢复 回去 。 


多 加 练习 UPDATE 和 DELETE 吧 。 如 果 你 使 用 出 错 的 话 ， 结 果 不 仅 影 响 到 你 ， 还 会 影响 到 
其 他 与 你 使 用 同一 个 数据 库 的 人 。 所 以 ， 对 于 下 一 节 的 习题 ， 你 应 比 以 往 更 认真 地 完成 
它们 。 


8.4 习题 


以 下 是 关于 UPDATE 和 DELETE 的 习题 。 如 果 你 还 未 从 MySQL 资源 站 (http://mysqlresources. 
com/files) 下 载 rookery 和 birdwatchers 库 ， 请 先 去 下 载 。 它 们 所 提供 的 数据 量 应 该 足以 
让 你 完成 以 下 题目 。 

(1) 用 CREATE TABLE...SELECT 语句 ( 详 见 $5.2 节 ) 复制 humans 表 和 prize_winners 表 ， 并 
将 新 表 分 别 命名 为 humans_copy 和 prize_winners_copy。 复 制 完 后 ， 用 SELECT 语句 查 出 
两 个 表 所 有 的 行 。 结 果 应 该 与 原 表 一 样 才 对 。 

(2) 做 完 上 题 之 后 ， 用 SELECT 语句 查 出 humans 表 中 所 有 奥地利 的 会 员 。 奥 地 利 的 country_ 
id 是 au， 你 会 用 到 WHERE 子 句 。 出 现 问题 的 话 ， 排 查 并 修正 ， 直 至 问题 解决 。 
接着 ， 抽 出 刚才 SELECT 中 的 WHERE 子 句 ， 构 建 一 个 UPDATE， 将 所 有 奥地利 的 会 员 改 成 
高 级 会 员 。 并 且 ， 在 同一 UPDATE 语句 中 ， 将 membership_expiration 改 成 一 年 之 后 (从 
你 执行 语句 的 时 刻 算 起 ) 。 这 里 你 需要 在 DATE_ADD() 中 使 用 CURDATE()。 而 CURDATE() 是 
不 需要 参数 的 ， 即 其 括号 中 不 应 有 任何 内 容 。 第 11 章 将 详细 介绍 这 两 个 国 数 。 如 果 你 
不 懂 如 何 将 两 个 函数 组 合 在 一 起 ， 也 可 以 直接 输入 日 期 (如 用 '2014-11-03' 表示 2014 年 
11 月 3 日 ,， 记得 加 上 引号 )。 更 新 数据 之 后 ， 用 SELECT 检查 修改 是 否 正确 。 

(3) 用 DELETE 语句 删 掉 humans 和 prize_winners 中 Barry Pilson 会 员 相关 的 行 。 我 们 在 讲解 
删除 多 个 表 的 数据 时 解释 过 怎样 做 。 删 完 之 后 ， 用 SELECT 检查 操作 是 否 无 误 。 
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(4) 用 DELETE 删 掉 humans 所 有 的 数据 ， 接 着 再 删 prize_winners 的 数据 。 然 后 用 SELECT 确 
认 是 否 两 个 表 都 空 了 。 
室 了 以 后 ， 用 INSERT. . .SELECT ( 详 见 6.3.2 节 )， 将 humans_copy 和 prize_winners_copy 
表 的 数据 分 别 复制 到 humans 和 prize_winners 中 。 
数据 都 导 回 来 之 后 ， 再 次 用 SELECT 确认 数据 是 否 完整 。 如 果 是 ， 则 用 DROP TABLE 删 掉 
humans_copy 和 prize_winners_copy 表 。 第 4 章 和 第 5 章 都 提 到 过 DROP TABLE 语句 。 无 
论 何 时 ， 如 果 删 错 了 表 或 行 ， 都 可 以 从 MySQL 资源 站 找 回 整个 数据 库 ， 继 续 练 习 。 
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表 连 接 和 了 查询 








为 了 让 你 着 眼 于 基本 的 语法 ， 此 前 的 大 多 数 例子 都 刻意 使 每 条 SQL 语句 只 操作 一 个 表 。 不 
过 ， 在 实际 的 数据 库 开 发 中 ， 多 表 查 询 是 很 常见 的 。 它 的 实现 方法 有 很 多 ， 其 中 有 些 已 经 



































在 前 面 的 章 市 中 讲 过 。 而 本 章 将 会 深入 讨论 以 下 话题 ， 如 何 合并 多 个 结果 集 ， 如 何 连 接 


表 ， 以 及 如 何 使 用 子 查询 得 出 类 似 的 结果 集 。 


全 

9.1 合并 结果 集 

先 看 看 如 何 将 多 个 SQL 语句 的 结果 集合 并 。 有 些 时 候 ， 你 只 是 想 将 两 个 不 相关 的 SELECT 
语句 的 结果 合 在 一 起 。 对 于 这 种 情况 ， 可 以 用 UNION 运算 符 。 它 能 组 合 两 个 SELECT 语句 ， 
得 出 一 个 合并 的 结果 集 (其 实 更 多 的 SELECT 也 是 可 以 的 ， 你 只 需 在 各 个 SELECT 之 间 写 上 


UNION 即 可 )。 


在 7.7 节 中 ， 
我 们 还 想 求 




















下 面 让 我 们 来 看 看 具体 的 例子 。 


我 们 试 过 统计 birds 表 中 Pelecanidae 科 〈 即 Pelican) 的 鸟 种 数量 。 现 在 假设 
H Ardeidae 科 〈 即 Heron) 的 鸟 种 数量 。 那 很 简单 : 复制 原本 的 SELECT， 然 后 














改 改 WHERE 中 的 条 件 。 而 如 果 你 想 将 这 两 个 结果 集合 在 一 起 显示 ， 那 么 可 以 用 UNION。 现 








在 ， 试 试 在 mysql 中 输入 以 下 语句 : 


SELECT 'Pelecanidae' AS 'Family', 
COUNT(*) AS 'Species' 
FROM birds, bird_families AS families 
WHERE birds.family_id = families.family_id 


AND 
UNION 


families.scientific_ name = 'Pelecanidae' 


SELECT 'Ardeidae', 
COUNT(*) 
FROM birds, bird_families AS families 
WHERE birds.family_id = families.family_id 
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AND families.scientific name = 'Ardeidae'; 


+---- +--------- + 
| Family | Species | 
+---- +--------- + 
| Pelecanidae | 10 | 
| Ardeidae | 157 | 
+---- +--------- + 











首先 需要 注意 的 是 ， 结 果 集 的 标题 只 从 第 一 个 SE 


的 第 一 


'Ardeidae', 














波 忽 略 ， 所 以 我 们 只 














LECT 语句 中 获取 。 再 者 ， 这 两 个 SELECT 





个 域 ， 都 不 是 取 自 实际 的 列 内 容 ， 而 是 取 自 我 们 给 出 的 文本 : “Petecanidae' 和 
在 MySQL 和 MariaDB 中 ， 这 是 可 以 的 。 如 果 你 想 创 造 出 一 个 域 ， 大 可 以 这 
样 写 。 而 且 ， 因 为 使 用 UNION 时，MySQL 只 会 取 第 
标题 ， 而 之 后 的 SELECT 的 域名 都 会 




















Rd eB oi 
第 一 个 SELECT 中 设置 了 域 的 别 


名 。 如 果 什么 别名 都 不 起 ， 那 么 它 就 直接 取 UNION 中 第 一 个 SELECT 的 列 名 。 


关于 UNION， 还 要 记 住 : 它 只 





复 的 行 在 结果 集中 合并 为 一 列 。 


合并 后 的 

















能 与 SELECT 语句 一 起 用 ;这些 SELECT 所 查 的 表 可 以 不 同 ; 重 





结果 集 ， 可 以 用 ORDER BY 来 排序 。 如 果 你 想 单独 对 某 个 SELECT 的 结果 集 排序 ， 





可 以 用 括号 将 该 SELECT 括 起 来 ， 并 加 一 个 ORDER BY 将 其 包围 (如 果 是 对 整个 UNION 排 


序 )。 


scientific_name), 




















在 ORDER BY 中 指定 列 时 ， 不 能 在 
如 果 该 列 名 有 歧义 ， 就 需要 使 用 列 的 别名 。 为 了 更 好 地 演示 如 何 

















列 名 的 前 





看 带 有 ( 原 表 的 ) 表 名 (比如 families. 





在 用 到 UNION 时 使 用 ORDER BY， 我 们 来 扩展 一 下 刚才 的 例子 : 查 出 Pelecaniformes 目 和 
Suliformes 目 中 各 个 科 的 鸟 种 数量 。 用 以 下 语句 ， 


SELECT families.scientific_name AS 'Family', 


COUNT(*) AS 'Species' 





FROM birds, bird_families AS families, bird_orders AS orders 
WHERE birds.family id = families.family_id 
AND families.order_id = orders.order_id 


AND orders.scientific name = 
GROUP BY families.family_id 


UNION 
SELECT families.scientific_name, COUNT(*) 
FROM birds, bird_families AS families, bird_orders AS orders 
WHERE birds.family id = families.family_id 
AND families.order_id = orders.order_id 
'Suliformes' 


AND orders.scientific name = 
GROUP BY families.family_id; 


+------------------- +--------- 十 
Family | Species | 
+------------------- +--------- + 
Pelecanidae | 10 | 
Balaenicipitidae | | 
Scopidae | 3 | 
Ardeidae | 157 | 
Threskiornithidae | 53 | 
Fregatidae | 13 | 
Sulidae | 16 | 
Phalacrocoracidae | 61 | 


'Pelecanifo 


rmes' 
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| Anhingidae 


+-------- +--------- + 














有 行 的 所 有 列 ， 关 
果 集 加 上 目 名 。 如 下 : 


种 子 查询 ， 

















SELECT * FROM 
( 


F 用 ORDER BY 来 才 


[| 


日 契 取 


SELECT families.scientific name AS 'Family', 
COUNT(*) AS 'Species', 
orders.scientific _ name AS 'Order' 


FROM birds, bird_families AS families, bird_orders AS orders 


WHERE birds.family_id = families.family_id 
AND families.order_id = orders.order_id 


AND orders.scientific_name 


GROUP BY families.family_id 


UNION 


'Pelecaniformes"' 


SELECT families.scientific name, COUNT(*), orders.scientific_name 


FROM birds, bird_families AS families, bird_orders AS orders 


WHERE birds.family_id = families.family_id 
AND families.order_id = orders.order_id 
AND orders.scientific_name = 'SuLiformes' 
GROUP BY families.family_id ) AS derived_1 


ORDER BY Family; 


Ep 


| Family 


Anhingidae 
Ardeidae 


Balaenicipitidae 


| 

| 

| 

| Fregatidae 
| Pelecanidae 
| 
| 
| 
| 


Phalacrocoracidae 


Scopidae 
Sulidae 


Threskiornithidae 


的 做 法 。 例 如 ， 当 你 需 
单 ， 但 却 需要 一 次 就 查 





机 
| 
4 
| 
| 
| 
| 
| 
| 
| 
| 
| 
本 








十 
| 
十 
| 
| 
| 
| 
| 
| 
| 
| 
| 
十 


Suliformes 
Pelecaniformes 
Pelecaniformes 
Suliformes 
Pelecaniformes 
Suliformes 
Pelecaniformes 
Suliformes 
Pelecaniformes 




















8 的 时 候 ，UNION 都 能 很 方便 地 给 出 一 个 整合 好 的 
除了 UNION， 上 例 用 子 查询 来 做 也 可 以 达到 同样 效果 ， 而 且 更 省 事 。 不 过 其 
因为 我 们 将 UNION 包 在 括号 里 了 。 本 章 将 在 稍 后 介绍 子 查 询 。 现 
如 何在 一 条 SQL 语句 中 连接 多 个 表 。 


以 上 例子 似乎 是 事倍功半 。 但 有 些 时 候 (虽然 这 种 时 候 不 多 ) ，UNION 确实 是 最 好 、 最 简单 
要 从 不 同 的 表 获 取 数 据 时 ， 又 或 者 是 尽管 发 起 多 条 SQL 语句 更 简 


结果 中 ， 前 五 行 是 Pelecaniformes 的 ， 剩 下 的 是 Suliformes 的 。 它 们 没有 按 字母 排序 ， 而 
是 按 每 个 SELECT 语句 的 执行 顺序 列 出 ， 而 每 个 SELECT 内 的 顺序 ， 又 按 family_id 来 排 。 
如 果 想 全 部 按 科 名 的 字母 序 来 排 ， 那 就 需要 在 这 个 结果 集 的 后 面 加 上 ORDER BY。 有 具体 来 
说 ， 就 是 将 该 结果 集 包 在 括号 中 ， 以 令 MySQL 将 其 当成 一 个 表 。 然 后 ， 查 询 该 “ 表 ” 所 
终 按 科 名 排序 。 另 外 ， 为 了 避免 混 消 ， 我 们 要 给 结 














结果 集 





一 | 








不 o 


实 上 例 也 是 一 
在 我 们 先 看 看 
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9.2 表 连 接 


我 们 可 以 基于 列 来 使 用 JOIN 子 句 连 接 两 个 表 ， 并 将 这 个 连接 放 在 SELECT、UPDATE 或 
DELETE 中 ， 以 做 数据 的 查询 、 更 新 或 删除 操作 。 例 如 ， 在 3.3.3 节 中 ， 因 为 books 表 的 
status 列 和 status_names 表 的 status_id 列 都 保存 了 状态 的 标识 号 ， 所 以 我 们 可 以 用 这 两 
列 来 进行 连接 ， 查 出 同一 本 书 在 两 个 表 上 对 应 的 信息 : 

SELECT book_id, title, statuyus_name 


FROM books JOIN status_names 
WHERE status = status_ id; 


现在 我 们 用 这 个 例子 来 回顾 一 下 连接 的 原理 。books 表 的 status 列 和 status_names 表 的 
status_id 列 都 存放 着 状态 的 编号 。 在 books 中 ， 那 个 编号 本 身 没有 含义 。 但 在 status_ 
names 中 ， 它 关联 着 一 个 状态 的 表述 。 因 此 ， 通 过 连接 两 表 ， 你 就 能 得 知 书 的 状态 描述 了 。 
有 时 ， 你 也 可 以 不 用 JOIN 子 句 ， 直 接 将 需要 查询 的 表 以 逗号 分 隔 的 方式 ， 列 在 SQL 语句 
中 的 适当 位 置 (如 果 是 SELECT 语句 ， 就 是 列 在 FROM 子 句 中 )， 然 后， 在 WHERE 中 写 出 用 
以 连接 的 列 。 我 们 在 前 几 章 用 过 这 种 做 法 。 虽 然 它 运行 起 来 没有 问题 ， 而 且 看 上 去 也 很 简 
洁 ， 但 我 还 是 推荐 你 用 JOIN 来 连接 两 个 表 ， 并 特别 指定 连接 条 件 。 当 SQL 语句 出 错时 ， 
将 连接 条 件 与 筛选 条 件 分 开 来 号， 更 有 利于 排查 问题 。 


JOIN 可 用 于 在 查询 、 更 新 或 删除 数据 时 ， 基 于 列 来 进行 表 连 接 。 它 通常 写 在 SQL 语句 中 
那个 指定 表 名 的 位 置 。 它 可 让 你 在 ON 中 写 连接 条 件 ， 而 不 用 在 WHERE 中 写 。 不 过 ， 这 时 
你 也 还 是 使 用 等 号 运算 符 来 指定 连接 的 列 。 如 果 列 有 多 对 ， 则 用 AND 分 隔 。 而 如 果 每 对 列 
中 ， 两 列 在 两 表 中 名 字 都 相同 ， 你 甚至 可 以 用 USING 来 做 。 只 需 在 随后 的 括号 中 ， 以 辟 号 
分 隔 的 方式 ， 写 出 两 表 共 有 的 列 即 可 。 使 用 USING 时， 连接 条 件 中 的 列 必 须 是 在 两 表 中 都 
存在 的 。 另 外 ， 为 了 提高 性 能 ， 用 于 连接 的 列 应 该 加 索引 。 


ON 的 写法 如 下 : 


SELECT book_id，titLe，status_name 
FROM books 
JOIN status_names ON(status = status id); 


这 与 之 前 的 那个 例子 一 样 ， 只 不 过 是 少 了 WHERE。 因 为 有 了 ON 来 指定 连接 条 件 ， 所 以 我 
们 已 经 不 需要 WHERE 了 。 如 果 要 把 books 的 status 列 改 成 与 status_names 的 一 样 ， 也 叫 
status_id， 那 么 就 可 以 采用 如 下 写法 : 

SELECT book_id, title, status_name 


FROM books 
JOIN status_names USING(status_id); 


这 里 ， 我 们 在 JOIN 子 句 中 使 用 USING 关键 字 ， 来 指定 连接 条 件 。 


以 上 只 是 JOIN 的 多 种 写法 中 的 两 种 ， 它 们 都 演示 了 如 何在 SELECT 中 使 用 JOIN。 在 UPDATE 
和 DELETE 中 ，JOIN 的 写法 也 基本 上 是 这 样 。 接 下 来 的 几 闻 会 给 出 一 些 示例 ， 以 说 明 这 三 
种 语句 带 JOIN 的 各 式 写 法 。 










































































9.2.1 基本 的 表 连 接 查询 


假设 现在 我 们 想 查 出 生存 状况 为 Threatened (这 是 某 一 类 状态 ) 的 Goose 鸟 ， 那 么 就 得 写 
一 条 SQL 语句 ， 从 birds 表 和 conservation_status 表 中 获取 数据 。 这 两 个 表 所 共用 的 数 
据 是 conservation_status_id 列 。 尽 管 没 有 必要 给 连接 列 起 相同 的 名 字 ， 但 这 样 做 能 让 人 
更 容易 知道 怎样 连接 两 表 。 


在 mysql 中 输入 以 下 命令 : 


SELECT common_name, conservation_state 

FROM birds 

JOIN conservation_status 

ON(birds.conservation_status_id = conservation_status.conservation_status_id) 
WHERE conservation_category = 'Threatened ' 

AND common_name LIKE '%Goose%'; 














+---------------------------- +-------------------- + 
| common_name | conservation state | 
+- +-------------------- 十 
| Swan Goose | Vulnerable | 
| Lesser White-fronted Goose | Vulnerable | 
| Hawaiian Goose | Vulnerable | 
| Red-breasted Goose | Endangered | 
| Blue-winged Goose | Vulnerable | 
+---------------------------- +-------------------- 十 





上 例 用 ON 来 指定 两 表 共 有 的 conservation_status_id 作为 连接 条 件 。 然 后 ，MySQL 自 
然 就 懂得 将 两 表 匹 配 的 行 牵扯 到 一 起 ， 并 从 恰当 的 表 中 获取 conservation_category 列 和 


common_name 下。 


虽然 这 么 写 是 正确 的 ， 但 语句 太 长 了 。 现 在 改 用 USING， 使 得 conservation_status_id 只 
需 声 明 一 次 。MySQL 会 知道 怎么 做 。 以 下 就 是 将 上 例 改 用 USING 运算 符 的 写法 : 


SELECT common_nNname, conservation_ state 
FROM birds 

JOIN conservation_status 
USING(conservation_status_id) 

WHERE conservation category = 'Threatened' 
AND common_name LIKE '%Goose%'; 


接着 ， 再 改 改 这 条 SQL 语句 ， 加 入 鸟 科 信息 。 为 了 实现 目标 ， 我 们 要 多 连接 一 个 表 ， 即 
bird_families。 同 时 ， 试 试 也 查 出 Duck: 


SELECT common_name AS 'Bird', 

bird_famiLLies.scientifiLc_name AS 'Family', conservation_state AS 'Status' 
FROM birds 

JOIN conservation_status USING(conservation_status_id) 

JOIN bird_families USING(family_id) 

WHERE conservation_category = 'Threatened ' 

AND common_name REGEXP 'Goose|Duck' 

ORDER BY Status, Bird; 
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Anatidae 
Anatidae 
Anatidae 
Anatidae 


+ 
| 
+ 
Laysan Duck 
Pink-headed Duck | 
BLue Duck 
Hawaiian Duck | 
Meller's Duck | Anatidae 
Red-breasted Goose | Anatidae 
White-headed Duck | Anatidae 
White-winged Duck | Anatidae 
Blue-winged Goose | Anatidae 
Hawaiian Goose | Anatidae 
Lesser White-fronted Goose | Anatidae 
Long-tailed Duck | Anatidae 
Philippine Duck | Anatidae 
Swan Goose | Anatidae 
West Indian Whistling-Duck | Anatidae 
White-headed Steamer-Duck | Anatidae 
+ 





+----------------------- + 
| Status | 
+----------------------- + 
| Critically Endangered 
| Critically Endangered 
| Endangered 
| Endangered 
| Endangered 
| Endangered 
| Endangered 
| Endangered 
| Vulnerable 
| Vulnerable 
| Vulnerable 
| Vulnerable 
| Vulnerable 
| Vulnerable 
| Vulnerable 
| Vulnerable 
+----------------------- + 


此 例 用 了 两 个 JOIN。 通 常 来 说 ， 表 的 先后 顺序 是 无 所 谓 的 。 比 如 说 ， 尽 管 我 们 将 bird_ 


families 写 在 conservation_status 之 后 ， 但 





是 birds 表 。 如 果 不 用 JOIN 的 话 ， 就 得 在 WH 
下 所 示 : 


SELECT common_name AS 'Bird', 

bird families.scientific name AS 'Family 
FROM birds, conservation status, bird_fa 
WHERE birds.conservation_status_id = con 
AND birds.family id = bird_ families.fami 
AND conservation_ category = 'Threatened ' 
AND common_name REGEXP 'Goose|Duck' 
ORDER BY Statuyus, Bird; 


MySQL 还 是 知道 与 bird_families 连接 的 
ERE 中 明确 指出 各 表 通 过 什么 列 来 连接 ， 如 





', Conservation_state AS 'Status 
milies 
servation_status.conservation_status_id 
ly_id 


这 个 WHERE 混杂 了 很 多 东西 ， 令 人 难以 分 辨 哪个 是 筛选 条 件 。 反 观 JOIN 就 清晰 得 多 了 。 


顺便 说 一 下 ， 上 面 那个 含有 两 个 JOIN 的 SQL 语句 还 用 到 了 正则 表达 式 (WHERE 中 的 
REGEXP) 来 指定 查询 Goose 或 Duck。 在 最 后 ， 我 们 还 加 了 一 个 ORDER BY 子 句 ， 使 结果 先 按 

















conservation_state、 后 按 common_name 排序 。 
不 过 ， 上 例 列 出 鸟 科 的 名 字 是 没有 意义 的 ， 因 





存在 一 些 我 们 想 看 到 的 岛 ， 因 为 不 符合 Goose| 
改 改 查 询 条 件 ， 并 将 结果 集 按 濒危 程度 从 低 往 


SELECT common_name AS 'Bird from Anatida 








为 所 有 结果 都 同属 一 科 。 另 外 ， 由 于 可 能 还 
Duck 这 个 条 件 而 没 被 查 出 ， 所 以 ， 我 们 决定 





高 排序 。 语 句 修改 如 下 : 


e', 


conservation_state AS 'Conservation Status' 


FROM birds 


JOIN conservation_status AS states USING(conservation_status_id) 


JOIN bird_families USING(family_id) 


WHERE conservation_category = 'Threatened' 


AND bird_fanmilies.scientific name = 'Ana 


tidae"' 


ORDER BY states.conservation_status_id DESC, common_name ASC; 
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+---------------------------- +----------------------- 十 
| Bird from Anatidae | Conservation Status 
+---------------------------- +----------------------- + 
| Auckland Islands Teal | Vulnerable 

| Blue-winged Goose | Vulnerable 

| Eaton's Pintail | Vulnerable 

| Hawaiian Goose | Vulnerable 

| Lesser White-fronted Goose | Vulnerable | 
| Long-tailed Duck | Vulnerable 

| Marbled Teal | Vulnerable 

| Philippine Duck | Vulnerable 

| Salvadori's Teal | Vulnerable 

| Steller's Eider | Vulnerable 

| Swan Goose | Vulnerable 

| West Indian Whistling-Duck | Vulnerable | 
| White-headed Steamer-Duck | Vulnerable | 
| Bernier's Teal | Endangered 

| BLue Duck | Endangered 

| Brown Teal | Endangered 

| Campbell Islands Teal | Endangered 

| Hawaiian Duck | Endangered 

| Meller's Duck | Endangered | 
| Red-breasted Goose | Endangered 

| Scaly-sided Merganser | Endangered 

| White-headed Duck | Endangered 

| White-winged Duck | Endangered 

| White-winged Scoter | Endangered 

| Baer's Pochard | Critically Endangered | 
| Brazilian Merganser | Critically Endangered | 
| Crested Shelduck | Critically Endangered | 
| Laysan Duck | Critically Endangered | 
| Madagascar Pochard | Critically Endangered | 
| Pink-headed Duck | Critically Endangered | 
+---------------------------- +----------------------- 十 


这 里 最 明显 的 改变 就 是 ，bird_families.scientific_name 列 没 有 了 ， 现 在 结果 中 只 剩 两 
列 。 而 另 一 个 改变 ， 则 是 增加 了 一 层 接口 一 一 给 conservation_status 表 起 了 别名 states， 
使 得 在 其 他 地 方 引 用 该 表 时 ， 不 用 再 输入 那么 长 的 表 名 。 


最 后 ，ORDER BY 将 结果 集 按 conservation_status_id 来 排序 ， 因 为 在 conservation_status 
表 中 ， 这 些 ID 原本 的 顺序 是 从 高 危 到 低 危 的 。 为 了 把 低 危 的 排 在 结果 集 的 前 头 ， 我 们 得 
加 一 个 DESC。 我 们 保留 了 按 俗名 排序 ， 只 不 过 这 次 写 的 是 实际 的 列 名 ， 而 不 是 别名 。 这 是 
因为 我 们 起 的 别名 叫 Bird from Anatidae (它们 确实 全 都 来 自 这 一 科 )， 在 ORDER BY 中 输 
入 这 申 东 西 太 麻烦 了 。 

接着 ,我 们 再 看 一 个 JOIN 的 简单 例子 。 假 设 我 们 想 得 知 有 哪些 俄罗斯 用 户 (他 们 的 
country_id 是 ru) 曾 发 现 过 Scolopacidae 科 的 鸟 (如 Sandpiper 和 Curlew 这 样 的 岸 乌 和 涉 
禽 )， 那 么 可 以 从 bird_sightings 表 查 询 鸟 种 发 现 点 的 信息 。 该 表 还 记录 了 鸟 种 发 现时 采 
集 自 用 户 手机 的 GPS 坐标 信息 。 输 入 以 下 SQL 语句 : 
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SELECT CONCAT(name_first, ' ', name_last) AS Birder, 
common_name AS Bird, location_gps AS 'Location of Sighting' 
FROM birdwatchers.humans 

JOIN birdwatchers.bird_sightings USING(human_id) 

JOIN rookery.birds USING(bird_id) 

JOIN rookery.bird_families USING(family_id) 

WHERE country_id = "ru' 

AND bird_families.scientific name = 'ScoLopacidae' 

ORDER BY Birder; 


+------------------- +------------------- +--------------------------- + 
| Birder | Bird | Location of Sighting 
+------------------- +------------------- +--------------------------- 十 
| Anahit Vanetsyan | Bar-tailed Godwit | 42.81958072; 133.02246094 | 
| Elena Bokova | Eurasian Curlew | 51.70469364; 58.63746643 

| Elena Bokova | Eskimo Curlew | 66.16051056; -162.7734375 | 
| Katerina Smirnova | Eurasian Curlew | 42.69096856; 130.78185081 | 
+------------------- +------------------- +--------------------------- + 


此 语句 连接 了 四 个 表 ， 其 中 两 个 来 自 birdwatchers 数据 库 ， 另 外 两 个 来 自 rookery 数据 


库 。 你 可 以 仔细 观察 这 条 SQL 语句 ， 思 考 一 下 为 什么 要 连接 这 四 个 表 。 那 是 




















到 这 个 结果 集 ， 这 四 个 表 都 是 必需 的 。 顺 便 说 一 下 ， 我 们 还 用 了 CONCAT() 函数 ， 把 会 员 的 
姓 和 名 拼接 在 一 起 ， 以 组 成 Birder 列 。 


JOIN 还 有 其 他 写法 ， 可 做 各 种 各 样 的 连接 。 现 在 我 们 就 来 试 试 。 比 如 说 ， 查 出 所 有 Egret 








及 其 每 种 的 保护 状态 。SQL 语句 如 下 : 


SELECT common_name AS 'Bird', 

conservation_state AS 'Status' 

FROM birds 

LEFT JOIN conservation_status USING(conservation_status_id) 
WHERE common_name LIKE '%Egret%" 

ORDER BY Status, Bird; 


+-------------------- +----------------- 十 
| Bird | Status | 
+-------------------- +----------------- + 
| Great Egret | NULL | 
| Cattle Egret | Least Concern | 
| Intermediate Egret | Least Concern | 
| Little Egret | Least Concern | 
| Snowy Egret | Least Concern | 
| Reddish Egret | Near Threatened | 
| Chinese Egret | Vulnerable | 
| Slaty Egret | Vulnerable 

+-------------------- +----------------- + 





这 个 SELECT 与 之 前 那些 例子 差不多 ， 只 是 它 用 的 是 LEFT JOIN， 而 不 是 JOIN。 这 种 写法 








会 使 数据 库 查 出 左 表 ( 即 birds) 的 所 有 行 ， 而 不 管 其 在 右 表 ( 即 conservation_status) 

















有 没有 对 应 的 行 。 因 为 无 法 找到 对 应 的 行 ， 所 以 MySQL 会 给 NULL。 如 以 上 结果 所 示 ， 
Great Egret 的 Status 为 NULL， 因 为 它 在 birds 中 的 conservation_status_id 没有 信息 。 
总 而 言 之 ， 如 果 birds 的 conservation_status_ id 是 NULL、 空 ( 即 '…)， 或 任何 在 右 表 无 
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法 找到 对 应 行 的 值 ， 那 么 Status 都 会 是 NULL。 


因为 本 例 使 用 的 是 LEFT JOIN， 所 以 ，birds 中 所 有 俗名 带 有 Egret 的 鸟 ， 包 括 那 些 保护 状 
态 未 知 的 ， 都 被 查 出 来 了 。 而 且 ， 这 也 提示 了 我 们 还 需要 为 哪些 岛 填写 保护 状态 。 我 们 可 
以 使 用 带 有 同样 LEFT JOIN 的 UPDATE 语句 来 填写 上 述 信 息 。 下 一 市 将 介绍 具体 做 法 。 


9.2.2 更 新 已 连接 的 表 


如 果 想 用 UPDATE 一 次 更 新 多 个 表 ， 或 想 以 其 他 表 来 限制 某 个 表 更 新 哪些 行 ， 可 以 使 用 
JOIN 子 句 。 在 UPDATE 中 使 用 JOIN 与 在 SELECT 中 无 异 。 所 以 ， 我 们 就 直接 看 一 些 实际 的 例 
子 吧 。 就 从 上 一 小 节 的 最 后 那个 例子 开始 。 


我 们 需要 用 UPDATE 加 上 LEFT JOIN， 来 找 出 btrds 表 中 没 填 conservation_status_id 的 行 。 
虽然 可 以 一 次 就 更 新 所 有 符合 条 件 的 行 ， 但 还 是 只 针对 Ardeidae 科 的 吧 ( 即 Heron、Egret 
和 Bittern)。 首 先 ， 执行 以 下 SELECT 语句 ， 检 查 一 下 连接 条 件 与 往 选 条 件 : 

SELECT common_name， 

conservation_state 

FROM birds 

LEFT JOIN conservation_status USING(conservation_status_id) 


JOIN bird_families USING(family_id) 
WHERE bird_families.scientific name = 'Ardeidae'; 


如 果 你 用 的 是 从 MySQL 资源 站 下 载 的 测试 数据 ， 那 么 应 该 能 查 出 150 多 行 。 你 会 看 到 
其 中 很 多 行 的 common_name 都 是 空 的 。 那 是 因为 确实 有 很 多 鸟 种 只 有 学 名 ， 没 有 俗名 。 同 
时 ， 这 些 鸟 的 conservation_status_id 也 为 空 。 而 在 那些 有 俗名 的 鸟 中 ， 也 有 一 些 的 
conservation_status_id 为 空 。 
现在 ， 给 conservation_status 增加 一 行 ， 以 代表 “不 明 状 态 ”(Unknown)。 接 着 我 们 把 那 
些 conservation_status_id 为 空 的 行 ， 更 新 成 这 种 状态 。 输 入 以 下 两 条 SQL 话 句 : 


INSERT INTO conservation_status (conservation_state) 
VALUES(C'Unknown ' ); 


















































SELECT LAST_INSERT_ID(); 


+------------------ 十 
| LAST_INSERT_ID() | 
+------------------ 十 
| :| 
+- -i + 


在 第 一 条 SQL 语句 中 ， 我 们 只 为 conservation_state 输入 了 值 ， 其 他 列 按 默 认 就 行 了 。 
因为 我 们 接 下 来 就 要 更 新 birds 中 Ardeidae 鸟 的 conservation_status_id， 所 以 得 先知 道 
Unknown 状态 的 ID 。LAST_INSERT_ID() 能 返回 本 连接 ( 即 当 前 连接 ) 最 近 一 条 SQL 语句 所 
生成 的 了 D 值 。 利 用 该 用 值 ， 我们 就 可 以 更 新 birds 的 conservation_status_id。SQL 语 
名 如 下 ，ID 按 实际 填写 。 


UPDATE birds 
LEFT JOIN conservation_status USING(conservation_status_id) 
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JOIN bird_families USING(family_id) 

SET birds.conservation _ status_id = 9 

WHERE bird_ families.scientific name = "Ardeidae' 

AND conservation_status.conservation_status_id IS NULL; 


此 UPDATE 语句 应 该 会 更 新 近 100 行 。 其 中 的 连接 与 之 前 的 那个 查询 哪些 Great Egret 没 
有 保护 状态 的 SELECT 里 的 一 样 。 但 在 WHERE 中 我 还 加 了 一 个 conservation_status . 
conservation_status_id IS NULL 这 样 的 条 件 。 虽 然 我 们 也 可 以 去 掉 LEFT JOIN， 直 接 更 
新 birds 中 conservation_status_id 为 NULL 的 行 ， 但 这 就 会 忽略 了 那些 找 不 到 对 应 状态 
的 行 ( 例 如 ，conservation_status_id 为 空 字符 串 )。 而 使 用 LEFT JOIN 后 ， 我 们 就 囊括 了 
birds 中 conservation_status_id 各 种 可 能 的 取 值 。 不 过 这 就 需要 按 conservation_status. 
conservation_status_id IS NULL 来 判断 ， 因 为 如 果 找 不 到 匹配 状态 的 话 ， 结 果 集 中 该 列 
会 返回 NULL。 


因为 JOIN 在 SELECT 和 UPDATE 中 的 用 法 一 样 ， 所 以 在 UPDATE 之前， 你 可 以 轻松 地 先 用 
SELECT 测试 JOIN 和 WHERE 写 得 是 否 正 确 。 确 认 无 误 后 ， 再 把 它 放 到 UPDATE 中 执行 。 这 是 
更 新 多 表 的 最 佳 流 程 。 


9.2.3 ”从 已 连接 的 表 中 删除 数据 


看 过 SELECT 和 UPDATE 的 JOIN 例子 后 ， 现 在 看 看 DELETE。8.2 节 已 经 介绍 过 一 种 在 DELETE 
中 使 用 JOIN 的 方法 。 该 例 中 ， 我 们 的 目的 是 删除 birdwatchers 库 的 humans 表 和 prize_ 
winners 表 中 ， 拥 有 yahoo.com 邮箱 的 会 员 Elena Bokova。 当 时 我 们 所 写 的 DELETE 语句 确 
实 能 达到 要 求 ， 但 它 其 实 有 一 个 潜在 问题 。 现 在 回头 看 看 那个 SQL 语句 。 

DELETE FROM humans, prize_winners 

USING humans JOIN prize winners 

WHERE name_first = "ELena' 

AND name_Last = 'Bokova' 


AND email_address LIKE '%yahoo.com' 
AND humans.human_id = prize winners.human_id; 


虽然 与 之 前 那些 JOIN 不 太一 样 ， 但 这 就 是 JOIN 在 DELETE 中 的 写法 。FROM 子 句 列 出 需要 
删除 数据 的 表 。USING 子 句 列 出 要 在 WHERE 子 句 中 用 于 指定 筛选 条 件 的 表 。USING humans 
JOIN prize_winners 的 意思 是 ， 在 WHERE 子 句 中 会 使 用 humans 和 prize_winners 这 两 个 表 
的 列 ， 来 第 选 哪些 行 会 被 删除 。 





















































不 要 把 USING.. .JOIN 和 JOIN...USING 搞 混 了 。 


按照 前 面 的 DELETE 语句 ， 如 果 humans 中 有 名 字 和 电子 邮箱 都 符合 的 行 ， 那 么 prize_ 
winners 中 也 必须 有 相应 的 human_id， 这 样 才 会 在 两 个 表 中 删除 数据 。 如 果 prize_winners 
不 匹配 ， 则 MySQL 连 humans 也 不 会 删除 ， 并 且 它 不 会 报错 一 一 于 是 你 可 能 对 错误 毫 无 察 
觉 。 考 虑 到 这 种 情况 ， 我 们 使 用 LEFT JOIN: 























DELETE FROM humans, prize winners 

USING humans LEFT JOIN prize winners 

ON humans.human_id = prize winners.human_id 
WHERE name_first = "ELena' 

AND name_Last = "Bokova' 

AND email_address LIKE '%yahoo.com'; 


注意 ， 以 上 语句 使 用 LEFT JOIN 和 ON 将 human_id 的 连接 写 在 了 USING 中 ， 而 不 是 WHERE 
中 。 这 是 必须 的 ， 因 为 若 写 在 WHERE 中 ， 如 果 两 个 表 不 匹配 ， 则 结果 集中 两 表 的 行 都 不 
会 出 现 ， 导 致 两 表 的 数据 都 不 会 被 删除 。 在 LEFT JOIN 的 情况 下 ， 符 合 筛选 条 件 并 且 两 
表 匹 配 的 行 自然 会 被 删除 ， 而 那些 符合 第 选 条 件 ， 但 在 prize_winners 中 找 不 到 对 应 行 的 
humans 行 ， 也 会 被 删除 。 这 样 做 可 以 消除 抓 立 行 。 

在 日 常 运 维 中 ， 我 们 应 该 偶尔 检查 一 下 prize_winners 中 是 否 有 在 humans 中 找 不 到 对 应 记 
录 的 行 。 如 果 有 ， 就 删 控 。 出 现 这 种 情况 可 能 是 因为 有 人 要 求 我 们 删除 账号 ， 但 我 们 删 的 
时 候 筷 了 删 其 他 关联 的 表 。 对 于 “prize_wtnners 有 但 humans 无 ”这 种 问题 ， 我 们 可 以 用 
RIGHT JOIN。 











DELETE FROM prize winners 

USING humans RIGHT JOIN prize_winners 

ON humans .human_id = prize winners.human_id 
WHERE humans .human_id IS NULL; 


此 FROM 子 句 中 ， 只 有 prize_winners 一 个 表 ， 这 是 因为 我 们 只 想 删除 该 表 的 数据 。 使 用 
DELETE 语句 时 ， 如 果 某 些 表 不 需要 执行 删除 操作 ， 就 不 用 在 FROM 中 列 出 这 些 表 。 这 是 一 
种 展 好 的 规范 ， 即 使 你 认为 它们 不 可 能 被 影响 到 。 

因为 在 USING 中， 我们 将 humans 放 在 prize_winners 左边 ， 并 使 用 RIGHT JOIN， 所 以 ， 即 
使 连接 时 在 左 表 (hunans) 中 找 不 到 对 应 行 ， 右 表 (prize_winners) 的 数据 也 会 被 出 除 。 
如 果 掉 转 表 的 位 置 ， 则 需要 换 成 LEFT JOIN 才能 删除 prize_winners 的 数据 。 


我 们 还 应 留意 上 例 中 最 后 那个 用 WHERE 来 检查 NULL 的 子 句 。 就 像 早 前 我 们 看 到 过 的 ， 
LEFT JOIN 和 RIGHT JOIN 在 找 不 到 对 应 行 时 ， 会 返回 NULL 组 成 的 行 。 因 此 ， 可 以 通过 
humans.human_id IS NULL 来 找 出 prize_winners 的 抓 立 数据 。 


JOIN 的 写法 有 很 多 。9.2.1 节 所 介绍 的 那些 基本 语法 是 最 应 该 好 好 掌握 的 ， 因 为 它们 是 最 常 
用 的 。 除 此 之 外 ， 有 时 你 还 会 用 到 LEFT JOIN 和 RIGHT JOIN。 接 下 来 ， 我 们 会 探讨 一 个 相 
关 的 话题 。 它 在 很 多 情况 下 都 很 适用 ， 那 就 是 子 查询 。 


9.3 汀 碍 询 


子 查 询 是 指 一 个 查询 被 包含 在 另 一 个 查询 之 中 ， 即 将 一 个 SELECT 放 在 另 一 条 SQL 语句 当 
中 。 子 查询 可 以 返回 一 个 值 、 一 行 数据 、 多 行 数据 的 某 一列 ， 或 多 行 数据 的 多 列 。 它 们 各 
被 称 为 标量 子 查询 、 列 子 查询 、 行 子 查询 和 表 子 查询 。 本 章 将 一 一 介绍 这 几 种 子 查询 。 
虽然 可 以 用 JOIN (或 者 有 时 用 UNION) 得 到 相同 效果 ， 但 在 某 些 情景 中 ， 子 查询 看 起 来 更 
清晰 。 它 能 将 复杂 的 查询 模块 化 ， 使 语句 更 容易 组 织 和 调试 。 以 下 就 是 两 种 通用 的 写法 
(其 实 我 们 在 第 8 章 也 用 过 子 查询 ) : 
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UPDATE table_1 
SET E05 
WHERE col_id = 
SELECT col_id 
FROM table_2 
WHERE col_1 = value; 


SELECT column_a, column_1 
FROM table_1 
JOIN 
(SELECT column_1, column_2 
FROM table 2 
WHERE column_2 = value) AS derived_table 
USING(col_id); 


第 一 个 例子 中 的 SELECT 是 内 部 查询 ， 而 UPDATE 则 是 外 部 查询 (或 称 主 查询 )。 在 第 二 个 例 
子 中 ， 括 号 里 的 SELECT 是 内 部 查询 ， 插 号 外 的 是 外 部 查询 。 包 含 子 查 询 的 外 部 查询 可 以 是 
SELECT、INSERT、UPDATE、DELETE、DO 或 者 甚至 是 SET。 不 过 有 个 限制 ;外 部 查询 一 般 不 能 
查询 或 修改 内 部 查询 所 查 的 表 。( 但 在 FROM 中 用 子 查询 时 ， 设 有 这 样 的 限制 。) 


这 些 通用 写法 可 能 有 点 难以 理解 。 其 实 子 查询 并 没有 特别 的 语法 ， 它 只 是 一 种 组 织 SQL 语 
句 的 方法 。 你 只 需要 考虑 以 下 两 点 。 


第 一 ， 如 何 将 子 查询 置 于 外 部 查询 之 中 。 举 个 例子 ， 如 果 外 部 查询 是 UPDATE， 那 么 可 以 将 
子 查询 放 在 WHERE 中 ， 用 于 筛选 哪些 行 需要 更 新 (就 像 刚 才 第 一 个 例子 ) ， 也 可 以 把 它 放 
到 外 部 SELECT 的 FROM 中 (如 第 二 个 例子 )。 这 些 位 置 都 是 可 以 的 。 一 个 外 部 查询 可 以 包含 
多 个 子 查询 ， 但 它们 一 般 都 被 放 在 FROM 和 WHERE 中 。 


第 二 ， 子 查询 所 返回 的 结果 是 否 符合 外 部 查询 所 需 。 比 如 说 ， 在 第 一 个 例子 中 ，UPDATE 里 
的 WHERE 需要 子 查 询 返回 一 个 值 。 如 果 你 写 的 子 查询 返回 多 个 值 、 一 行 数 据 或 一 个 表 式 的 
结果 集 ， 那 么 MySQL 会 报错 。 总 之 ， 子 查询 必须 返回 外 部 查询 所 需 类 型 的 数据 。 


再 多 看 一 些 例子 ， 你 就 会 明白 上 述 两 点 。 如 本 市 开头 所 提 到 的 ， 子 查询 分 为 标量 子 查 询 、 
列子 查询 、 行 子 查询 和 表 子 查询 。 以 下 几 小 节 将 通过 示例 来 介绍 每 一 种 类 型 。 


9.3.1 标量 子 查询 


最 基本 的 子 查询 就 是 返回 单个 值 的 标量 子 查询 。 它 在 WHERE 中 与 = 搭配 起 来 特别 有 用 。 事 
实 上 ， 只 要 是 接受 返回 单个 值 的 表达 式 的 地 方 ， 都 可 以 放置 标量 子 查询 。 下 面 来 看 一 个 
简单 例子 。 查 出 Galliformes 目的 鸟 科 ( 即 Grouse、Partridge、Quail 和 Turkey) 。birds 和 
bird_families 的 关联 可 以 用 JOIN 轻松 实现 。 现 在 用 标量 子 查 询 试 试 。 


SELECT scientific_name AS Family 
FROM bird_families 
WHERE order_id = 
(SELECT order_id 
FROM bird_orders 
WHERE scientific_name = 'Galliformes'); 
































































































































| Megapodiidae | 
| Cracidae | 
| Numididae | 
| Odontophoridae | 
| Phasianidae | 





此 处 的 内 部 查询 ( 子 查 询 ) 只 返回 一 个 值 ，order_id。 它 用 于 补充 外 部 查询 的 WHERE 子 句 。 
这 很 简单 。 我 们 再 看 一 个 例子 。 
在 9.2.1 节 中 ， 有 个 例子 是 查询 观察 到 Scolopacidae 科 的 俄罗斯 用 户 。 现 在 为 了 答谢 他 们 使 
用 我 们 的 手机 应 用 来 登记 发 现 ， 我 们 打算 从 他 们 之 中 抽 一 个 人 ， 给 他 〈 她 ) 一 年 的 高 级 会 
员 权 限 。 这 会 用 到 以 下 SQL 语句 : 
UPDATE humans 
SET membership_type = 'premium', 
membership_expiration = DATE_ADD(IFNULL(membership_expiration, 
CURDATE()), INTERVAL 1 YEAR) 
WHERE human_id = 
(SELECT human_id 
FROM 
(SELECT human_id, COUNT(*) AS sightings, join_date 
FROM birdwatchers.bird_sightings 
JOIN birdwatchers.humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
JOIN rookery.bird_families USING(family_id) 
WHERE country_id = "ru' 
AND bird_families.scientific name = 'Scolopacidae' 
GROUP BY human_id) AS derived_1 
WHERE sightings > 5 
ORDER BY join_date DESC 
LIMIT 1); 


这 里 ， 最 内 层 的 那个 查询 与 我 们 之 前 用 来 查找 “观察 到 Scolopacidae 科 的 俄罗斯 用 户 ” 的 
语句 差不多 。 ee 员 注 册 时 
间 )。 然 后 ， 对 bird_sightings 中 符合 鸟 科 条 件 和 国家 条 件 的 条 目 ， 使 用 GROUP BY， 将 结 
果 集 按 human_id 分 组 ， 并 用 COUNT() 进行 计数 。 这 个 子 查询 会 返 回 一 个 像 表 一 样 的 结果 
集 ， 所 以 ， 它 是 表 子 查询 。 我 们 会 在 后 面 详细 介绍 它 。 


包 住 这 个 最 内 层 子 查询 的 那个 SELECT， 也 是 一 个 子 查询 。 它 只 查 出 最 内 层 结果 集中 
sightings 大 于 5 的 行 ， 并 将 新 用 户 排 在 前 面 。 我 们 希望 给 予 发 现 Curlew 鸟 的 最 新 注册 的 
俄罗斯 用 户 一 年 的 高 级 权限 。 这 个 子 查询 只 返回 一 行 一 列 ， 它 是 一 个 标量 子 查询 。 


最 后 ， 主 查询 用 这 个 标量 子 查询 所 返回 ee 定位 到 那个 要 被 给 予 高 级 权限 的 用 户 。 


如 果 在 标量 子 查询 中 没有 LIMIT， 那 么 它 就 会 返回 多 个 值 一 一 这 样 就 不 是 标量 子 查询 了 。 
人 一 条 这 样 的 错误 


信息 : 
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ERROR 1242 (ER_SUBSELECT_NO_1_ROW) 
SQLSTATE = 21000 
Message = "Subquery returns more than 1 row" 


其 实 所 有 的 子 查 询 都 可 以 用 JOIN 或 其 他 复杂 的 手法 来 替换 。 在 某 种 程度 上 ， 这 取决 于 你 的 
编码 风格 。 而 我 一 般 就 喜欢 用 子 查询 ， 尤 其 是 在 PHP 或 Perl 应 用 中 。 这 有 利于 我 在 几 个 
月 或 几 年 以 后 想 要 做 修改 时 ， 识 别 自 己 写 过 的 代码 。 


9.3.2 ”列子 查询 

上 一 小 节 已 讨论 过 如 何在 WHERE 中 使 用 标量 子 查 询 。 不 过 ， 有 些 时 候 我 们 还 可 能 会 需要 匹 
配 多 个 值 。 这 种 多 值 匹配 的 情况 ， 需 要 用 子 查询 加 上 IN， 而 IN 通常 需要 带 上 一 堆 以 逗号 
分 隔 的 值 。 现 在 我 们 来 看 看 它 。 

在 上 一 小 节 的 一 个 例子 中 ， 我 们 试 过 用 标量 子 查询 来 查 出 Galliformes 目的 所 有 科 。 现 在 假 
设 我 们 希望 结果 集中 每 个 科 都 带 有 一 个 该 科 某 一 种 鸟 的 俗名 ， 而 这 个 “ 某 一 种 鸟 "， 要 从 
每 科 随机 抽取 。 想 实现 这 种 效果 ， 我 们 得 写 一 个 子 查询 ， 查 出 该 目的 所 有 科 名 。 输 入 以 下 
SQL 话 句 : 


SELECT * FROM 
(SELECT common_name AS 'Bird', 
families.scientific_name AS 'Family' 
FROM birds 
JOIN bird_families AS families USING(family_id) 
JOIN bird_orders AS orders USING(order_id) 
WHERE common_name != "" 
AND families.scientific_name IN 
(SELECT DISTINCT families.scientific_name AS 'Family' 
FROM bird_families AS families 
JOIN bird_orders AS orders USING(order_id) 
WHERE orders .sctientiLfiLc_name = "GaLLiformes' 
ORDER BY Family) 
ORDER BY RAND()) AS derived 1 
GROUP BY (Family); 







































































+------------------------ +---------------- + 
| Bird | Family 

+------------------------ +---------------- + 
| White-crested Guan | Cracidae | 
| Forsten's Scrubfowl | Megapodiidae | 
| Helmeted Guineafowl | Numididae | 
| Mountain Quail | Odontophoridae | 
| Gray-striped Francolin | Phasianidae | 
+------------------------ +---------------- + 


这 个 SQL 语句 有 两 个 子 查 询 ， 一 个 套 着 另 一 个 ， 然 后 再 被 最 外 层 的 查询 包 着 。 最 里 层 的 
是 一 个 肯 套 子 查询 。 这 里 所 有 的 子 查询 都 会 比 其 外 层 的 先 执行 ， 也 就 是 说 ， 执 行 第 二 层 的 
WHERE 上 时， 可 以 使 用 最 内 层 的 结果 集 。 对 于 这 里 的 和 藤 套 子 查询 来 说 也 一 样 ， 它 会 先 于 外 本 
的 那个 子 查询 执行 。 此 例 中 ， 嵌 套子 查询 ( 即 缩 进 最 多 的 那个 ) 被 包 在 IN() 中 ， 它 查 的 是 
Galliformes 目 含 有 的 全 部 科 名 。 而 加 在 别名 Family 上 的 DISTINCT 会 对 科 名 进行 去 重 。 如 
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果 手 动 输 入 科 名 的 话 ， 就 会 是 这 样 : ('Cracidae','Megapodiidae','Numididae','0dontopho- 
ridae','Phasianidae')。 这 个 子 查 询 是 一 个 多 值 子 查 询 ， 或 叫 列子 查询 。 


其 中 ， 第 二 层 的 查询 是 一 个 表 子 查询 。 它 列 出 最 内 层 子 查询 提供 的 岛 科 所 含 的 全 部 鸟 种 。 
在 这 一 层 上 ， 我 们 可 以 对 科 进 行 GROUP BY 操作 ， 获 取 每 个 科 中 的 一 种 鸟 。 不 过 ， 它 获取 到 
的 都 是 结果 集中 每 个 科 的 第 一 行 数据 ， 这 样 每 次 运行 该 SQL 语句 ， 得 到 的 岛 都 会 是 同一 
种 。 而 我 们 希望 每 次 随机 显示 不 同 的 岛 ， 因此， 得 先 对 结果 集 使 用 ORDER BY RAND() 来 打 
乱 顺序 。 最 后 才 用 男 一 个 SELECT 包 住 它 ， 并 对 科 进 行 GROUP BY 操作 ， 获 取 每 个 科 中 的 一 
种 鸟 。 


9.3.3” 行 子 查询 


行 子 查 询 返 回 单行 数据 ， 供 外 层 查 询 使 用 。 你 可 以 在 WHERE 中 用 它 来 与 一 组 列 进行 比较 ， 
以 饰 选 数 据 。 我 们 先 讲 一 个 例子 ， 然 后 再 深入 探讨 。 假 设 又 有 一 个 观 鸟 网 站 关闭 了 ， 这 是 
一 个 东欧 的 网 站 。 他 们 把 自己 的 数据 库 发 给 我 们 ， 里面 有 一 个 会 员 名 字 的 表 ， 还 有 一 个 保 
存 了 会 员 所 发 现 的 鸟 类 的 表 。 我 们 打算 将 这 两 个 表 导 入 我 们 的 birdwatchers 库 。 在 导入 的 
过 程 中 ， 我 们 发 现 有 些 人 已 是 我 们 的 会 员 一 一 不 过 这 没 问 题 ， 我 们 知道 如 何 去 重 。 而 对 于 
岛 类 发 现 表 ， 因 为 会 员 是 有 重复 的 ， 所 以 鸟 类 发 现 的 登记 可 能 也 有 重复 。 于 是 我 们 得 逐条 
检查 ， 确 保 只 有 不 重复 的 才能 被 导入 。 看 看 以 下 SQL 语句 : 


INSERT INTO bird_sightings 
(bird id，human_id，time_seen，Location_gps) 
VALUES 
(SELECT birds.bird_id, humans.human_id, 
date_spotted, gps_coordinates 
FROM 
(SELECT personal_name, family_name, science_name, date_spotted, 
CONCAT(latitude, '; ', longitude) AS gps_coordinates 
FROM eastern_birders 
JOIN eastern_birders_spottings USING(birder_id) 
WHERE 
(personal_name, family_name, 
science_ name, CONCAT(latitude, '; ', longitude) ) 
NOT IN 
(SELECT name_first, name_last, scientific name, location_gps 
FROM humans 
JOIN bird_sightings USING(human_id) 
JOIN rookery.birds USING(bird id) ) ) AS derived 1 
JOIN humans 
ON(personal_name = name first 
AND family_name = name_last) 
JOIN rookery.birds 
ON(scientific name = science name) ); 


这 看 起 来 很 复杂 ， 很 难看 懂 ， 或 很 难 写 好 。 我 们 先 来 把 主要 的 部 分 搞 清楚 。 先 看 看 最 里 层 
括号 的 那个 戏 套 子 查 询 。 这 里 查 的 是 我 们 自己 的 数据 : 会 员 名 字 、 所 发 现 的 鸟 种 和 发 现 
地 。 这 个 租 套 子 查 询 被 放 在 另 一 个 子 查 询 的 WHERE 中 ， 那 个 子 查询 是 一 个 行 子 查询 。 注 意 ， 
行 子 查 询 的 列 要 用 括号 括 起 来 。 因 此 ， 这 个 WHERE 的 意思 是 ， 用 eastern_birders 表 连 接 
的 每 一 行 的 这 些 列 ， 与 我 们 所 有 的 会 员 名 字 、 所 发 现 的 鸟 种 和 发 现 地 进行 对 比 。 经 对 比 筛 
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选 后 的 结果 ， 通 过 最 外 层 的 INSERT 插入 bird_sightings 表 。 


这 个 例子 确实 很 少见 ， 而 且 好 像 也 不 必 写 得 这 么 复杂 。 但 有 些 时 候 像 这 样 的 行 子 查询 还 是 
很 有 用 的 。 简 单 来 说 ， 刚 才 那 个 例子 要 做 的 是 ， 对 于 要 导入 的 每 一 行 ， 如 果 在 我 们 的 库 中 
已 经 有 同一 个 人 在 同一 地 点 发 现 了 同一 种 鸟 ， 则 不 导入 ;否则 ， 人 允许 导入 。 实 现 这 个 任务 
其 实 也 有 别 的 办 法 ， 如 用 一 个 临时 表 以 及 多 条 SQL 语句 ， 或 使 用 Perl 或 PHP 来 编写 程序 。 
不 过 ， 我 觉得 你 还 是 应 该 知道 一 条 SQL 语句 也 能 完成 此 任务 ， 尤 其 是 在 有 必要 这 么 写 时 。 


9.3.4” 表 子 查询 


子 查询 可 以 返回 表 式 的 结果 集 ， 供 外 部 查询 获取 数据 。 把 这 样 的 子 查询 放 在 FROM 里 ， 可 将 
它 当 作 表 使 用 。 我 们 把 此 种 情况 称 作 提取 表 。 


使 用 表 子 查询 需要 遵守 一 些 规则 。 每 个 提取 表 都 必须 有 一 只 要 不 与 其 他 表 重 名 
即 可 。 起 别名 时 可 以 使 用 As 关键 字 。 每 个 提取 表 内 ， 列 名 也 不 能 重复 。 如 果 提 取 表 中 有 
两 个 相同 的 列 ， 那 么 其 中 至 少 有 一 个 得 起 另外 的 名 字 。 提 取 表 不 可 以 写成 相关 子 查询 ， 即 
在 提取 表 中 不 能 引用 外 部 查询 的 数据 。 


我 们 用 本 章 开 头 的 一 个 UNION 例子 来 讲解 表 子 查询 。 该 例 分 别 用 两 个 SELECT 来 统计 
Pelecanidae 和 Ardeidae 的 鸟 种 总 数 ， 然 后 ， 再 用 UNION 合并 两 个 结果 集 。 这 种 写法 很 条 
拙 。 我 们 可 以 用 表 子 查询 来 改良 它 。 在 此 子 查询 中 ， 我 们 只 会 选 出 那 两 个 科 的 所 有 鸟 的 科 
名 。 列 出 这 么 多 重复 的 科 名 ， 看 起 来 好 像 很 厌 ， 尤 其 是 我 们 本 来 就 知道 它们 的 科 名 。 但 其 
实 ， 那 是 为 了 按 科 名 来 分 组 统计 ， 我 们 没 要 MySQL 将 这 个 子 查询 的 结果 显示 出 来 。 因 为 
在 外 部 使 用 了 GROUP BY， 所 以 ， 最 终结 果 是 一 个 科 一 条 记录 。SQL 语句 如 下 : 


SELECT family AS 'Bird Family', 
COUNT(*) AS 'Number of Birds' 
FROM 
(SELECT families.scientific_ name AS family 
FROM birds 
JOIN bird_families AS families USING(family_id) 
WHERE families.scientific name IN('Pelecanidae','Ardeidae')) AS derived 1 
GROUP BY family; 











































































































+---- +----------------- 十 
| Bird Family | Number of Birds | 


| Ardeidae | 157 | 
| Pelecanidae | 10 | 


这 样 统计 两 个 科 的 总 数 ， 比 用 UNION 好 得 多 。 要 想 查 其 他 科 ， 只 需 在 子 查 询 的 WHERE 中 添 
加 科 名 ， 而 不 再 需要 为 每 个 科 编 写 一 条 SELECT。 


从 这 个 例子 可 以 看 出 ，FROM 中 的 表 子 查询 ， 用 起 来 就 和 普通 的 表 一 样 。 你 甚至 可 以 给 

起 个 别名 (如 derived_1) ， 就 像 给 表 起 别名 那样 。 外 部 查询 的 GROUP BY 将 该 表 子 查询 按 
family ( 子 查询 中 scientific_name 的 别名 ) 分 组 。 另 外 ， 在 外 部 SELECT 中 ， 我 们 也 再 次 
用 到 了 fantLy。 如 有 果 表 子 查询 中 的 列 有 别名 ， 则 外 部 必须 使 用 该 别名 来 引用 该 列 ， 原 列 名 
在 外 部 将 不 再 可 用 。 























| 全 A 


130 第 9 章 


9.3.5 ” 子 查 询 的 性 能 考虑 


如 果子 查询 组 合 得 不 好 ， 就 会 有 性 能 问题 。 在 WHERE 的 IN() 中 使 用 子 查询 可 能 会 导致 性 能 
损失 。 如 果 出 现 这 种 情况 ， 可 以 试 试用 多 个 column = value 对 来 代 赫 ， 或 改 用 JOIN， 并 用 
BENCHMARK() 函数 比较 一 下 两 种 写法 的 性 能 。 你 也 可 以 到 Oracle 的 网 站 (http://dev.mysql. 
com/doc/reftman/5.6/en/optimizing-subqueries.html) ， 参 考 一 些 子 查询 的 性 能 优化 提示 。 


9.4 小结 


很 多 开发 者 都 倾向 于 使 用 子 查 询 ， 我 也 如 此 。 子 查询 便于 组 合 和 拆 解 ， 有 助 于 解决 问题 。 
如 果 你 使 用 的 是 有 着 庞大 访问 量 的 大 型 数据 库 ， 那 么 子 查 询 就 不 太 适 合 了 ， 因 为 可 能 会 
性 能 问题 。 而 小 型 数据 库 则 没什么 问题 。 你 得 学 会 使 用 子 查 询 和 不 使 用 子 查询 《〈 例 如， 用 
JOIN 来 代替 )， 这 样 就 无 惧 任何 状况 。 因 为 你 无 法 预计 自己 的 下 一 个 老板 或 下 一 班 队友 嘉 
欢 哪 一 种 写法 ， 所 以 ， 两 种 都 会 才 比较 好 。 


学 习 JOIN 是 无 可 避免 的 。 很 少 有 人 不 用 JOIN。 本 章 几 乎 所 有 的 子 查询 示例 都 显示 出 ， 即 
使 你 喜欢 子 查 询 ， 但 JOIN 依然 有 用 。 而 UNION 应 该 是 很 少 用 到 的 。 学 着 精通 JOIN， 不 要 
对 它 有 抵触 ， 多 练习 含有 JOIN 的 语句 ， 这 样 才能 更 好 地 掌握 它 。 


9.5 习题 


以 下 习题 会 让 你 用 JOIN 来 连接 表 或 编写 子 查 询 。 在 解 题 的 过 程 中 ， 多 思考 一 下 多 个 表 的 
数据 是 怎么 走 到 一 起 的 。 试 着 将 每 个 表 幻 想 成 一 张 纸 ， 纸 上 是 一 行 行 记录 ， 考 虑 怎样 在 桌 
上 放置 这 些 纸 才能 按 它们 的 关系 查 出 数据 。 你 可 以 用 左手 食指 指 着 左边 的 一 张 纸 上 的 一 条 
记录 ， 然 后 用 右手 食指 指 着 右边 的 另 一 张 纸 上 的 记录 。 于 是 ， 两 条 记录 就 连接 在 一 起 了 。 
而 你 两 手 所 指向 的 那 一 列 ， 就 是 连接 点 。 做 习题 时 ， 想 着 这 个 画面 ， 大 声 说 出 你 在 连接 什 
么 ， 你 让 MySQL 做 什么 操作 。 这 样 会 帮助 你 更 好 地 理解 表 连 接 和 子 查 询 。 

(1) birdwatchers 库 中 有 个 bird_sightings 表 ， 用 来 记录 会 员 在 野外 发 现 了 什么 鸟 。 假 设 

我 们 举办 一 场 比赛 ， 看 看 哪个 会 员 发 现 了 最 多 Galliformes 目的 鸟 ， 并 予以 奖励 。 计 分 
规则 是 每 发 现 一 次 ， 得 一 分 。 
你 需要 构建 一 条 SQL 语句 ， 统 计 每 个 会 员 的 发 现 数 。 要 求 结果 集 显 示 两 列 : 一 列 
是 human id， 别 名 为 Birder; 另 一 列 是 发 现 数 ， 别 名 为 Entries。 你 可 以 将 bird_ 
sightings 与 birds、bird_families 和 bird_orders 连接 起 来 ， 以 完成 此 任务 。 注 意 ， 
它们 不 在 同一 个 数据 库 中 。 另 外 ， 你 还 需要 使 用 COUNT() 函数 和 GROUP BY 子 句 。 整 条 
语句 只 能 用 JOIN， 不 得 用 子 查 询 。 最 终结 果 集 类 似 于 如 下 形式 : 





















































+-------- +--------- + 
| Birder | Entries | 
+-------- +--------- 
| 19 | 1 | 
| 28 | 5 | 
+-------- +--------- + 
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做 完 上 题 ， 修 改 SQL 语句 ， 以 连接 humans 表 。 拼 接 出 会 员 的 姓名 (使 用 CONCAT()， 姓 
和 名 之 间 要 有 空格 ) ， 取 代 human_id。 别 名 不 变 。 要 求 最 终结 果 如 下 (人 名 和 分 数 可 能 


不 同 )。 
+--- +-------- 十 
| Birder | Points | 
+--- +-------- + 
| Elena Bokova | 4 | 
| Marie Dyer | 8 | 
+-------------- +-------- 十 




















(2) 上 题 已 查 出 每 个 会 员 发 现 了 多 少 次 Galliformes。 现 在 ， 来 些 更 刺激 的 。 不 要 每 次 发 现 就 
计 分 ， 而 是 每 一 科 只 有 一 种 鸟 能 被 计 分 ， 即 发 现 同一 种 鸟 多 次 ， 也 不 会 加 分 。 并 且 , 无 
论 一 科 发 现 了 多 少 种 鸟 ， 也 只 计 一 分 。 我 们 会 让 会 员 根据 指南 去 栖息 地 找 鸟 。 这 样 应 该 
更 好 玩 。 
为 了 适应 比赛 规则 的 变更 ， 你 得 修改 上 题 最 后 的 那 条 SQL 语句 。 首 先 ， 在 外 部 查询 的 
列 前 面 加 上 DISTINCT， 并 去 掉 CONCAT() 和 GROUP BY。 改 完 后 ， 运 行 一 遍 ， 检 查 是 否 有 


误 。 在 正确 的 结果 中 ， 应 该 会 H 
































H 现 某 些 会 员 有 多 行 记录 。 接 着 ,将 整 条 SQL 语句 置 于 


男 一 条 SQL 语句 中 ， 使 其 成 为 子 查 询 。 而 在 那个 新 的 外 部 查询 中 才 用 CONCAT()， 并 用 
GROUP BY 对 会 员 和 科 进 行 分 组 统计 。 结 果 大 概 会 是 如 下 形式 。 


+-------------- +-------- 十 
| Birder | Points | 
+--- +-------- 十 
| ELena Bokova | 1 | 
| Marie Dyer | 5 | 
+--- +-------- 十 


(3) Galliformes 目 有 五 个 科 。 根 据 以 上 的 比赛 规则 ， 满 分 应 该 是 5。 现 在 再 改 改 SQL 语句 ， 
要 求 上 只 列 出 5 分 会 员 。 将 刚才 的 SQL 语句 包 在 另 一 条 SQL 语句 之 中 ， 造 出 向 套子 查 
询 。 执 行 整 条 SQL 语句 的 结果 如 下 。 








+------------ +-------- + 
| Birder | Points | 
+------------ +-------- 十 
| Marie Dyer | 5 | 
+------------ +-------- + 
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第 四 部 分 
内 置 函 数 





MySQL 有 很 多 内 置 函数 可 助 你 对 列 中 的 数据 进行 操作 。 有 了 它们 ， 你 就 可 以 格式 化 数 
据 ， 提 取 文 本 ,或 者 创建 搜索 表达 式 。 不 过 ， 函 数 本 身 是 不 更 改 表 中 数据 的 ， 其 功能 仅仅 
是 返回 一 个 新 的 值 。 然 而 ， 如 果 在 某 些 SQL 语句 (如 UPDATE) 中 使 用 得 当 ， 我 们 也 是 可 
以 用 它们 来 修改 数据 的 。 顺 便 说 一 下 ， 使 用 函数 时 ， 参 数 可 以 是 普通 的 文本 或 数字 ， 不 一 
定 是 列 。 
函数 主要 分 成 三 类 : 字符 串 函 数 ， 日 期 和 时 间 函 数 ， 数 字 和 算术 函数 。 字 符 串 函数 与 文本 
的 转换 和 格式 化 相关 ， 当 然 也 包括 从 列 中 查找 和 提取 文本 。 具 体内 容 会 在 第 10 章 讲解 。 
日 期 和 时 间 函 数 在 第 11 章 讲解 。 它 们 可 以 格式 化 日 期 和 时 间 值 ， 以 及 从 某 个 日 期 或 时 间 
值 中 抽取 内 容 ， 黄 至 还 可 以 从 系统 歼 取 日 期 和 时 间 值 ， 以 用 于 插入 或 更 新 数据 。 


数字 和 算术 函数 用 于 数学 计算 或 统计 ， 会 在 第 12 章 讲 解 。 
这 三 章 不 会 介绍 全 部 的 函数 ， 而 只 会 提 及 各 类 函数 中 最 常用 以 及 较 有 用 的 那些 。 因 为 它们 
也 属于 学 习 和 开发 MySQL 与 MariaDB 的 一 部 分 ， 所 以 你 应 努力 掌握 它们 。 
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字符 串 函 数 








所 谓 字符 串 ， 就 是 一 个 包含 字母 、 数 字 或 其 他 字符 (例如 及 、$) 的 值 。 一般人 们 不 会 把 


字符 串 中 的 数字 当成 数 。 而 什么 时 候 该 用 字符 串 来 保存 数字 ， 则 要 看 上 下 文 环境 ， 





以 及 该 


数字 所 代表 的 意义 。 例 如 ， 美 国 的 邮编 全 是 由 数字 组 成 的 ， 但 不 能 用 整数 类 型 存储 它们 。 


因为 如 果 用 整数 类 型 ，02138 就 会 变 成 2138， 所 以 在 这 种 情况 下 我 们 只 能 用 字符 串 。 
为 了 方便 处 理 字 符 串 ，MySQL 提供 了 很 多 相关 的 内 置 函数 ， 可 用 于 格式 化 字符 





WHERE 中 构造 更 合适 的 表达 式 ， 或 者 抽取 和 修改 字符 串 和 列 中 的 内 容 。 所 以 ， 这 一 章 就 
来 介绍 一 些 字符 串 函 数 。 我 会 将 它们 按 功 能 分 类 列 出 ， 并 提供 一 些 例子 ， 以 展示 它们 的 


用 法 。 





函数 的 基本 使 用 方法 

使 用 函数 时 ， 有 几 点 需要 注意 。 字 符 事 函数 有 自己 的 一 些 使 用 规则 。 其 中 有 尘 规 

因 服 务 器 的 设 定 而 异 。 

。 函数 的 基本 语法 ， 就 是 关键 字 后 紧 接 着 用 括号 括 起 来 的 参数 。 注 意 ， 与 SQL 
符 (如 WHERE 中 的 IN ()) 不 同 的 是 ， 函 数 关键 字 与 括号 之 间 不 能 有 空格 。 

。 有 些 函 数 不 需 要 参数 (例如 返回 当前 日 期 和 时 间 的 NON()) ， 而 其 他 函数 则 需要 
数量 的 参数 。 各 参数 一 般 以 喜 号 分 了 局， 参数 的 取 值 可 以 是 其 他 函数 的 返回 值 〈 
可 以 谋 套 )。 

。 文本 作为 参数 时 ， 需 要 使 用 引号 。 

。 列 作 为 参数 时 ， 不 要 用 引号 一 一 否则 列 名 会 被 当成 文本 。 如 果 列 名 是 保留 字 或 
可 能 引起 问题 的 字符 ， 可 用 反 引 号 标示 列 名 。 
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则 会 


运算 


二 外 


含有 





。 如 果 字 符 串 函数 返回 的 值 过 长 〈( 即 返回 了 太 多 的 字符 串 ) ， 超 出 了 系统 限制 (max_ 
aLLowed_packet 选项 ) ，MYySQL 就 会 返回 NULL。 


。 有 些 参数 用 于 指定 字符 串 中 字符 的 位 置 。 字 符 串 第 一 个 字符 的 位 置 是 1， 不 是 0。 
当 需 要 从 后 往 前 数 时 (有些 函数 允许 这 么 做 ) ， 最 后 一 个 字符 的 位 置 是 -1。 


。 有 些 参数 用 于 表示 字符 事 长 度 。 如 果 用 到 小 数 ，MySQL 就 会 将 其 四 含 五 入 为 最 接 
近 的 整数 。 


10.1 格式 化 字符 串 


有 些 字符 串 函 数 可 用 于 格式 化 或 重组 文本 ， 以 使 其 显示 成 更 好 的 形式 。 所 以 ， 你 可 以 将 数 
据 按 原样 保存 ， 或 分 在 多 列 或 多 个 地 方 中 ， 然 后 在 获取 数据 时 ， 用 一 些 字符 串 函 数 让 它们 
按 你 想 要 的 格式 展示 。 


例如 在 humans 表 中 ， 为 了 便于 按 姓 或 按 名 来 排序 ， 我 们 将 一 个 人 的 称谓 、 名 和 姓 分 成 三 
列 保存 ， 而 当 需 要 完整 显示 时 ， 用 函数 将 它们 拼凑 起 来 。 下 面 我 们 就 来 看 看 这 是 如 何 做 
到 的 。 


10.1.1 拼接 字符 串 


CONCAT() 可 以 把 多 列 的 内 容 粘 在 一 起 ， 或 给 某 列 数据 追加 内 容 。 它 可 能 是 最 常用 的 字符 串 
函数 一 一 前 面 有 些 例子 就 已 经 用 过 。 它 的 使 用 方法 ， 就 是 在 括号 中 ， 以 辟 号 分 隔 的 方式 ， 
写 出 你 想 组 合 的 字符 串 、 列 或 其 他 元 素 。 


现在 看 看 如 何在 SELECT 中 使 用 CONCAT()。 假 设 我 们 想 得 知 哪些 用 户 发 现 了 哪些 鸟 ， 可 以 使 
用 如 下 语句 : 


SELECT CONCAT(formal_title, '. ', name_first, SPACE(1), name_last) AS Birder, 
CONCAT(common_name, ' - ', birds.scientific name) AS Bird, 

time_seen AS 'When Spotted ' 

FROM birdwatchers.bird_sightings 

JOIN birdwatchers.humans USING(human_id) 

JOIN rookery.birds USING(bird_id) 

GROUP BY human_id DESC 






































LIMIT 4; 

+---------------------- 4 +-------------------- + 
| Birder | Bird | When Spotted | 
+---------------------- 4 +-------------------- + 
| Ms. Marie Dyer | Red-billed Curassow - Crax btLu...| 2013-10-02 07:39:44| 
| Ms. Anahit Vanetsyan | Bar-tailed Godwit - Limosa lap...| 2013-10-01 05:40:00| 
| Ms. Katerina Smirnova| Eurasian Curlew - Numenius arq...| 2013-10-01 07:06:46| 
| Ms. Elena Bokova | Eskimo Curlew - Numenius borea...| 2013-10-01 05:09:27| 
+---------------------- 4 +-------------------- 十 





结果 集中 的 第 一 列 ， 不 是 来 自 表 中 单个 的 列 ， 而 是 用 CONCAT() 将 观 鸟 者 的 称谓 和 姓名 合成 
而 得 的 。 因 为 我 们 保存 的 称谓 不 带 句点 ， 所 以 还 得 另外 将 句点 拼 进 去 。 而 第 二 列 则 是 由 鸟 














的 俗名 和 学 名 拼接 而 成 ， 两 个 名 字 中 间 还 加 了 空格 和 横 线 。 

如 果 没 有 CONCAT()， 我 们 就 只 能 把 分 开 的 列 合成 一 列 来 存储 了 ， 比 如 说 ， 将 俗名 和 学 名 合 
成 一 列 ， 即 使 它们 本 该 分 开 。 分 成 多 列 能 使 数据 库 更 高 效 、 更 具 扩展 性 。 当 需要 合成 一 个 
域 来 显示 时 ， 用 CONCAT() 即 可 。 

还 有 一 个 不 太 常 用 的 拼接 函数 ， 即 CONCAT_Ws()。 它 可 以 在 拼接 列 时 ， 在 列 之 间 加 插 指 定 
的 分 隔 符 。 我 们 要 在 第 一 个 参数 处 写 明 想 要 使 用 的 分 隔 符 ， 而 剩 下 的 参数 就 是 被 拼接 的 内 
容 。 当 需要 生成 符合 其 他 程序 接口 的 数据 时 ， 此 函数 会 很 有 用 。 


举 个 例子 ， 我 们 现在 打算 给 每 个 高 级 用 户 发 一 个 绣 有 Rookery 字样 的 绣花 徽章 。 其 中 ， 配 
送 的 事情 会 交 由 一 家 广告 和 营销 公司 来 处 理 。 该 公司 需要 我 们 提供 一 份 包含 会 员 姓名 和 地 
址 的 文本 文件 ， 并 且 ， 每 行 的 每 个 值 要 用 坚 线 分 了 喇 。 于 是 ， 我 们 这 么 做 : 

mysql -p --skip-column-names -e \ 

"SELECT CONCAT_WS('|', formal_title, name_first, name_last, 

street address, city, state province, postal_code, country_id) 


FROM birdwatchers.humans WHERE membership_type = 'premium’ 
AND membership expiration > CURDATE();" > rookery_patch mailinglist.txt 


此 例 用 到 了 几 个 mysqt 命令 的 选项 。--skip-column-names 会 让 MySQL 不 显示 列 名 一 一 
因为 我 们 只 需要 数据 部 分 。-e 的 意思 是 执行 后 面 引 号 中 的 内 容 。 于 是 我 们 就 在 它 后 面 写 
上 SQL 语句 ， 并 使 用 双 引 号 。 语 名 中 ，CONCAT_WS() 的 第 一 个 参数 ， 就 是 公司 所 要 求 的 竖 
线 。 剩 下 的 参数 ， 就 是 要 串 起 来 的 列 。 双 引号 闭合 之 后 ， 我 们 用 了 > 来 将 结果 重 定向 到 一 
个 文本 文件 中 ， 以 便 接 下 来 发 给 该 公司 。 不 过 这 条 语句 有 个 潜在 的 问题 : 如 果 某 列 的 值 为 
NULL， 则 CONCAT_NS() 不 会 输出 该 列 ， 也 不 会 显示 紧 贴 的 两 个 紧 线 ， 来 提示 你 有 NULL 
值 。 这 种 情况 大 概 如 下 : 


Ms|Rusty|0sborne|ch 
Ms|ELena|Bokova|ru 


虽然 我 们 要 求 返 回 八 列 ， 但 这 两 个 会 员 只 输出 了 四 列 。 如 果 这 两 行 混 在 了 数 千 行 数据 之 
中 ， 那 将 会 很 难 被 发 现 ， 并 在 之 后 的 处 理 中 导致 出 错 。 虽 然 看 起 来 很 笨拙 ， 但 我 们 可 以 使 
用 IFNULL() 函数 ， 指 定 遇 到 NULL 时 ， 改 为 显示 其 他 内 容 (例如 unknown 或 空格 ) 。 以 下 
是 用 IFNULL() 修改 上 例 的 样子 : 

mysql -p --skip-column-names -e \ 

"SELECT CONCAT_WS('|', IFNULL(formal_title, ' '), IFNULL(name_first, ' '), 

IFNULL(name_last, ' '), IFNULL(street address, ' '), 

IFNULL(city, ' '), IFNULL(state_province, ' '), 

IFNULL(postal_code, ' '), IFNULL(country _id, ' ')) 


FROM birdwatchers.humans WHERE membership_type = 'premium' 
AND membership_expiration > CURDATE();" > rookery_patch mailinglist.txt 


写 起 来 很 麻烦 、 很 喝 嗪 ， 不 过 也 没什么 ， 反 正 MySQL 能 运行 。 于 是 ， 结 果 变 成 : 
Ms|Rusty|0sborne| | | | |ch 
Ms|ELena|Bokova| | | | |ru 
这 样 检查 起 来 就 容易 多 了 。 它 能 被 营销 公司 正常 导入 ， 而 公司 在 发 现 有 遗漏 的 信息 上 时， 可 
再 联系 我 们 补 齐 。 那 时 他 们 只 需 更 新 漏 掉 的 那些 ， 而 不 必 重 新 导入 。 
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10.1.2 设置 大 小 写 和 引号 


有 时 ， 你 或 许 会 想 将 某 列 的 文本 全 部 转换 成 小 写 ， 或 全 部 转换 成 大 写 。 可 以 用 LOWER() 和 
UPPER()， 它 们 又 可 以 分 别 写成 LCASE() 和 UCASE()。 如 以 下 例子 ， 第 一 列 就 被 转换 成 了 小 
写 ， 第 二 列 被 转换 成 了 大 写 。 


SELECT LCASE(common_name) AS Species， 
UCASE(bird_families.scientific name) AS Fanmily 
FROM birds 

JOIN bird_families USING(family_id) 

WHERE common_name LIKE '%Wren%" 

ORDER BY Species 





LIMIT 5; 

4- +--------------- + 
| Species | Family | 
4- +--------------- + 
| apolinar's wren | TROGLODYTIDAE | 
| band-backed wren | TROGLODYTIDAE | 
| banded wren | TROGLODYTIDAE | 
| bar-winged wood-wren | TROGLODYTIDAE | 
| bar-winged wren-babbler | TIMALIIDAE | 
4- +--------------- + 














QUOTE() 国 数 接受 字符 串 输 入 ， 然 后 将 其 用 单 引 号 包围 ， 再 输出 。 此 外 ， 它 还 会 对 某 些 字 
符 进行 转换 ， 使 输出 内 容 作 为 SQL 话 句 或 其 他 编程 语言 的 输入 时 ， 不 会 造成 问题 。 会 转换 
的 字符 包括 : 单 引 号 、 反 和 斜 枉 、 空 〈 零 ) 字 节 ， 以 及 Ctrl-Z 字符 。QUOTE() 会 在 这 些 字符 
前 加 上 反 斜 杜 ， 以 避免 它们 被 当成 中 断 的 标志 ， 或 过 早 地 财 合 单 引号 。 
看 看 以 下 查询 以 Prince 或 Princess 命名 的 鸟 的 代码 : 

SELECT QUOTE(common_name) 

FROM birds 


WHERE common_name LIKE "%Prince%" 
ORDER BY common_name; 


























| 'Prince Henry\'s Laughingthrush' | 
| 'Prince Ruspoli\'s Turaco' | 
| 'Princess Parrot' | 


























因为 使 用 了 QuoTE() 函数 ， 所 以 结果 中 的 字符 串 都 被 单 引号 包 了 起 来 ， 而 且 字 符 串 中 的 单 
引号 都 加 上 了 反 斜 本 。 这 就 避免 了 传递 到 其 他 程序 时 被 识别 错 的 可 能 。 


10.1.3 ”修剪 和 补充 字符 串 


网 站 接受 公众 输入 数据 时 ， 需 要 考虑 到 ， 有 些 人 是 很 粗心 的 。 他 们 可 能 会 在 文本 的 前 后 输 
入 空格 。 想 去 除 列 中 文本 开头 或 结尾 的 空格 ， 有 几 个 函数 可 供 选择 : LTRIM() 可 去 掉 开 头 
的 空格 ，RTRIM() 可 去 掉 结尾 的 空格 ， 而 TRIM() 则 更 厉害 ， 能 一 下 子 去 掉 两 头 的 空格 。 


























你 可 以 用 这 些 函 数 配 合 UPDATE 语句 ， 对 数据 进行 整顿 。 下 面 就 来 看 看 例子 ， 用 LTRIM() 和 
RTRIM() 去 除开 头 和 结尾 的 空格 。 
UPDATE humans 


SET name_first = LTRIM(name_first), 
name_Last = LTRIM(name_last); 





UPDATE humans 
SET name_first = RTRIM(Name_first), 
name_Last = RTRIM(name_last); 


此 例 先 用 第 一 条 UPDATE 去 掉 开 头 的 空格 ， 再 用 第 二 条 去 掉 结 尾 的 空格 。 注 意 ， 来 源 列 和 目 
标 列 都 是 同一 列 ， 但 新 值 已 经 被 去 掉 空 格 。 我 们 也 可 以 将 两 句 合成 一 句 : 
UPDATE humans 


SET name_first = LTRIM( RTRIM(name_last) ) ， 
name_Last = LTRIM( RTRIM(name_last) ); 


你 可 以 像 这 样 将 国 数组 合 在 一 起 ， 一 次 就 造成 更 大 的 变化 。 不 过 ， 如 果 想 去 掉 两 头 的 空 
UPDATE humans 


SET name_first = TRIM(Cname_first)， 
name_Last = TRIM(name_last); 


TRIM() 还 有 很 多 选项 。 你 可 以 指定 要 移 除 的 字符 ， 而 不 只 是 空格 。 例 如 ， 假 设 我 们 又 收 
到 了 来 自 另 一 个 观 鸟 俱乐部 的 一 份 数据 ， 就 像 9.3.3 节 中 一 样 。 不 过 ， 在 这 次 所 给 的 表 中 ， 
鸟 种 的 学 名 用 双 引 号 包 起 来 了 。 如 果 想 将 这 些 数据 导入 bird_sightings 表 的 话 ， 只 需 在 上 
次 那 条 SQL 语句 的 基础 上 ， 加 上 TRIM() 即 可 。 以 下 代码 片段 是 两 表 的 连接 方式 ， 我 们 就 
是 要 修改 这 里 : 
































JOIN rookery.birds 
ON(scientific name = TRIM(BOTH '"' FROM science name) ) ); 


可 能 不 太 容 易 看 出 ， 但 我 们 确实 使 用 单 引 号 指明 了 要 去 掉 的 字符 〈 双 引号 )。 基 中 ，BOTH 
不 是 必需 的 ， 因 为 本 身 默 认 就 是 BOTH， 所 以 之 前 用 TRIM() 时 我 都 没 写 。 如 果 只 想 去 掉 某 
一 端的 字符 ， 可 以 指定 LEADING 或 TRAILING， 使 TRIM() 实现 LTRIM() 或 RTRIM() 的 效果 。 
而 默认 被 去 掉 的 字符 ， 如 之 前 所 见 ， 就 是 空格 。 


当 需 要 在 Web 表单 或 类 似 的 地 方 展示 数据 时 ， 你 或 许 会 想 填充 一 些 像 句 点 之 类 的 字符 。 例 
如 ， 对 于 长 度 不 定 的 VARCHAR 列 ， 用 可 见 的 字符 来 填充 ， 让 用 户 看 出 长 度 的 极限 。 实 现 填 
充 的 函数 有 LPAD() 和 RPAD()， 还 有 SPACE() ， 它 以 空格 进行 填充 。 


SELECT CONCAT(RPAD(common_name, 20, '.' )， 
RPAD(Families.scientific_ name, 15, '.'), 
Orders.scientific name) AS Birds 

FROM birds 

JOIN bird_families AS Families USING(family_id) 
JOIN bird_orders AS Orders 

WHERE common_name != "" 

AND Orders.scientific name = 'Ciconiiformes' 
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ORDER BY common_name LIMIT 3; 


4 + 
| Birds | 
4 + 
| Abbott's Babbler....Pellorneidae...Ciconiiformes | 
| Abbott's Booby...... Sulidae........ Ciconiiformes | 
| Abbott's Starling...Sturnidae...... Ciconiiformes | 
4 + 


注意 上 例 是 如 何 使 科 和 目 在 垂直 方向 上 对 齐 的 。 方 法 就 是 ， 用 RPAD() 把 每 个 值 都 填充 至 最 
大 长 度 。 这 里 ， 第 一 个 参数 是 所 读 取 的 列 ， 第 二 个 参数 是 所 需 的 最 终结 果 的 总 长 度 ， 而 第 
三 个 参数 是 句点 ， 这 就 使 得 原文 本 长 度 不 中 了， 会 以 句点 来 填充 。 因 为 MySQL 使 用 的 是 
等 宽 字 体 ， 所 以 出 来 的 结果 会 很 整齐 。 你 也 可 以 用 空格 填充 ， 结 果 也 一 样 会 是 对 齐 的 。 在 
网 页 上 显示 的 话 ， 则 要 用 &nbsp; (不 换行 空格 ) 来 填充 。 


10.2 ”抽取 文本 


有 些 函 数 可 用 于 从 文本 中 抽取 内 容 。 使 用 时 ， 需 要 指定 从 哪里 开始 抽 (起 始 位 置 )， 以 及 
抽 多 长 。 这 类 函数 有 四 个 : LEFT()、MID()、RIGHT() 和 SUBSTRING()。 此 外 ，SUBSTRING __ 
INDEX() 也 算 与 此 有 点 关系 。 下 面 我 会 逐一 介绍 它们 。 


先 看 看 LEFT()、MID() 和 RIGHT()。 假 设 我 们 的 营销 代理 有 一 个 叫 prospects 人 里 面 含 

有 一 些 观 鸟 者 的 数据 。 每 个 观 鸟 者 的 称谓 、 姓 和 名 都 合并 在 prospect_name 这 一 列 中 ， 而 

电子 邮箱 则 由 另 一 列 存储 。prospect_name 是 定 长 的 CHAR(54) 。 旧 销 代理 说 ， 该 列 的 前 4 

个 字符 是 称谓 ， 接 着 的 25 个 字符 是 名 ， 最 后 的 25 个 字符 是 姓 。 其 中 ， 称 谓 只 有 Mr. 或 

并 在 后 面 再 加 一 个 空格 ， 即 用 4 个 字符 来 表示 称谓 。 但 对 于 我 们 来 说 ， 只 需 抽取 前 
字符 放 到 我 们 的 表 中 即 可 。 现 在 ， 先 拿 四 条 记录 来 看 看 数据 的 大 概 样子 : 


SELECT prospect_name 
FROM prospects LIMIT 4; 
























































4 + 
| prospect_name | 
4 + 
| Ms. Caryn-Amy Rose | 
| Mr. Colin Charles | 
| Mr. Kenneth Dyer | 
| Ms. Sveta Smirnova 

4 + 





de 称谓 、 姓 和 名 的 长 度 都 是 固定 的 。 一 般 来 说 ，MySQL 保存 CHAR 时 ， 会 将 结尾 
空格 去 掉 。 而 给 该 表 录 入 数据 的 人 ， 应 该 是 使 用 了 SET sql_mode = 'PAD_CHAR_TO_FULL_ 

ne 强制 数据 库 按 4、25、25 的 格式 保存 这 些 文本 。 

我 们 可 以 使 用 INSERT INT0…SELECT 以 及 一 些 函 数 ， 将 这 些 数据 进行 拆 分 和 抽取 ， 然 后 导 


入 我 们 新 建 的 membership_prospects 表 。 在 真正 INSERT 之 前 ， 先 用 SELECT 验证 函数 的 使 
用 是 否 无 误 : 























SELECT LEFT(prospect_name，2) AS title, 
MID(prospect_name, 5, 25) AS first_name， 
RIGHT(prospect_name, 25) AS last_name 
FROM prospects LIMIT 4; 


+------- 4 + 


+ 
| title | first_name | Last_name 

+------- +--------------------------- +--------------------------- + 
| Ms | Caryn-Amy | Rose 

| Mr | Kenneth | Dyer 

| Mr | Colin | Charles 

| Ms | Sveta | Smirnova 

+------- +--------------------------- +--------------------------- + 


由 此 例 可 见 ，LEFT() 抽取 数据 时 ， 起 始 位 置 是 第 一 个 字符 ， 而 参数 中 的 数字 ( 即 2) 是 想 
要 抽取 的 长 度 。RIGHT() 也 类 似 ， 不 过 它 是 从 右 往 左 数 的 。 而 MID() 就 有 点 不 同 ， 它 可 以 
指定 起 始 位置 (例如 我 们 就 指定 了 从 第 5 个 字符 开始 ) 和 抽取 长 度 。 

SUBSTRING() 与 MID() 相同 ， 因 此 它们 的 语法 也 一 模 一 样 。 默 认 情 况 下 ， 如 果 没 有 指 
定 抽取 长 度 ， 那 么 它 就 会 抽取 从 起 始 位 置 直至 末尾 的 内 容 ， 效 果 就 像 LEFT()。 而 如 果 
SUBSTRING() 和 MID() 的 第 二 个 参数 是 负数 ， 则 会 从 右 往 左 抽取 该 数字 所 表示 的 绝对 值 的 长 
度 ， 效 果 就 像 RIGHT()。 
因为 SUBSTRING() 的 不 同 写 法 能 带 来 不 同 效 果 ， 所 以 我 们 可 以 用 它 来 完成 上 面 的 需求 。 


SELECT SUBSTRING(prospect_name, 1, 2) AS title, 
SUBSTRING(prospect_name FROM 5 FOR 25) AS first_name, 
SUBSTRING(prospect_name, -25) AS Last_name 

FROM prospects LIMIT 3; 


此 例 展 示 了 SUBSTRING() 的 三 种 用 法 。 

SUBSTRING(prospect_name，1，2) AS title 
这 种 已 见 过 : 三 个 参数 分 别 指定 文本 的 列 、 起 始 位 置 和 抽取 长 度 。 

SUBSTRING(prospect_name FROM 5 FOR 25) AS first_name 
这 是 元 长 写法 。 此 处 5 代表 起 始 位 置 ，25 代表 抽取 长 度 。 

SUBSTRING(prospect_name, -25) AS Last_name 
将 起 始 位 置 指定 为 -25， 但 因为 没有 指定 抽取 长 度 ， 所 以 MySQL 抽取 从 右 往 左 数 的 25 个 
a 
到 底 该 用 哪 种 ， 其 实 随 你 选择 。 
SUBSTRING_INDEX( ) 与 SUBSTRING() 相似 ， 但 它 不 是 抽取 “哪些 字符 ”， 而 是 “哪些 元 素 ”， 
其 中 ， 元 素 是 由 特定 的 分 隔 符 区 分 的 。 例 如 ， 假 设 prospect_nanme 的 结构 有 变 ， 现 在 它 里 
看 的 称谓 、 名 和 姓 不 是 定 长 的 ， 而 是 用 竖 线 拼接 在 一 起 (虽然 看 起 来 很 怪 ， 但 确实 可 能 
有 人 这 么 保存 数据 )。 于 是 ， 我 们 就 将 竖 线 当成 分 隔 符 ， 来 拆 分 这 一 列 〈 第 一 和 第 三 行 的 
SUBSTRING_INDEX() 很 好 理解 ， 而 第 二 行 的 就 有 点 复杂 了 ) : 
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SELECT SUBSTRING_INDEX(prospect_name, '|', 1) AS title, 

SUBSTRING_INDEX( SUBSTRING_INDEX(prospect_name, '|', 2), '|', -1) AS first_name, 
SUBSTRING_INDEX(prospect_name, '|', -1) AS last_name 

FROM prospects WHERE prospect id = 7; 


SUBSTRING_INDEX() 的 第 二 个 参数 ， 用 于 指定 分 隔 符 。 于 是 ， 我 们 写 上 了 '1'。 第 三 个 参数 
用 于 指定 抽取 多 少 个 元 素 。 例 如 ， 在 第 三 行 中 ， 因 为 是 -1， 所 以 就 是 从 右 往 左 抽取 一 个 。 
而 在 第 二 行 中 ， 一 个 SUBSTRING_INDEX() 套 着 男 一 个 ， 这 样 ， 内 部 的 SUBSTRING_INDEX() 就 
抽取 了 前 两 个 元 素 。 然 后 ， 外 部 的 SUBSTRING_INDEX() 再 从 该 结果 中 抽取 最 后 一 个 元 素 。 


如 果 你 已 经 知道 了 起 始 位 置 和 抽取 长 度 ， 那 么 SUBSTRING() 会 比较 好 用 。 如 果 要 在 刚才 
“ 竖 线 分 隔 ” 的 例子 中 使 用 SuBSTRING()， 我 们 得 先知 道 紧 线 的 位 置 。 而 要 得 知 坚 线 的 位 
置 ， 我 们 还 需 借 助 其 他 搜索 函数 。 下 一 节 将 对 它们 进行 介绍 。 


10.3 ”搜索 字符 串 及 使 用 长 度 函 类 


MySQL 和 MariaDB 在 模式 搜索 方面 并 不 完善 。 虽 然 REGEXP 运算 符 可 做 一 些 模式 匹配 ， 但 
与 PHP 或 Perl 之 类 的 编程 语言 相 比 ， 这 还 是 太 弱 了 。 不 过 ， 我 们 还 有 其 他 一 些 能 辅助 搜 


10.3.1 在 字符 串 中 找 出 某 段 子 串 的 位 置 
MySQL 和 MariaDB 提供 了 一 些 内 置 函数 ， 可 让 你 在 字符 串 中 找 出 某 段 子 串 的 位 置 。 


LOCATE() 能 返回 一 个 数字 ， 代 表 子 串 第 一 次 在 字符 串 中 出 现时 的 位 置 。 顺 便 说 一 下 ， 在 找 
到 一 次 出 现 之 后 ， 它 就 会 停止 往 后 查找 。 现 在 来 看 一 个 例子 ， 假 设 我 们 想 获取 Avocet 鸟 
(属于 Recurvirostridae 科 的 岸 乌 ) 的 一 个 列表 


SELECT common_name AS 'Avocet' 

FROM birds 

JOIN bird_families USING(family_id) 

WHERE bird_families.scientific_ name = 'Recurvirostridae' 
AND birds.common_name LIKE '%Avocet%'" ; 






















































































| Pied Avocet | 
| Red-necked Avocet | 
| Andean Avocet | 
| American Avocet | 








再 假设 我 们 想 去 掉 结果 中 的 Avocet 字眼 。 有 几 种 做 法 : 其 中 一 种 就 是 使 用 LOCATE() 找 出 
Avocet 的 位 置 ， 然 后 用 SUBSTRING( ) 抽取 该 位 置 之 前 的 文本 : 


SELECT 

SUBSTRING(common_name, 1, LOCATE(' Avocet', common_name) ) AS 'Avocet' 
FROM birds 

JOIN bird_families USING(family_id) 





WHERE bird_families.scientific name = 'Recurvirostridae' 
AND birds.common_name LIKE '%Avocet%'; 


+---- + 
| Avocet | 
+---- + 
| Pied | 
| Red-necked | 
| Andean | 
| American | 
+---- + 





这 个 例子 虽然 有 点 转弯 抹 角 ， 但 我 们 可 以 学 习 到 怎样 将 LOCATE() 与 其 他 函数 配合 使 用 ， 返 
回 我 们 想 要 的 结果 。 下 面 再 看 另 一 个 例子 。 


在 10.1.3 节 中 ， 我 们 试 过 合并 其 他 观 鸟 俱乐部 的 数据 。 其 中 涉及 了 使 用 TRIM() 来 去 掉 乌 种 
学 名 两 端的 双 引 号 。 现 在 ， 再 拿 它 来 作 例子 ， 不 过 这 次 假设 它 没有 双 3 引 号 了 ， 而 是 变 成 了 
这 样 的 格式 : 每 种 乌 的 名 字 都 带 有 其 科 名 ,并且 乌 种 名 和 科 名 以 两 端 带 有 空格 的 模 线 (-) 
隔 开 。 于 是 ， 我 们 就 用 LOCATE() 来 找 出 横 线 的 位 置 ， 然 后 用 SUBSTRING() 获取 科 名 ， 与 我 
们 的 birds 表 进 行 连接 。 以 下 是 JOIN 部 分 : 















































JOIN rookery.birds 
ON(scientific name = SUBSTRING(science name, LOCATE(' - ', science name) + 3 ) ); 


现在 来 解析 这 个 例子 。 首 先 看 看 LOCATE()。 它 所 做 的 是 在 science_name 中 查找 两 端 带 有 空 
格 的 横 线 ， 然 后 返回 该 串 出 现 的 位 置 。 之 后 ， 我 们 还 在 其 返回 结果 的 基础 上 加 3， 因 为 该 
串 的 长 度 就 是 3 个 字符 。 换 名 话说 ，LOCATE() 返回 的 是 该 串 第 一 个 字符 在 science_name 中 
的 位 置 ， 而 我 们 要 的 是 紧 接着 该 串 的 那个 字符 的 位 置 。 因 此 ，SUBSTRING() 的 起 始 位 置 就 
是 LOCATE() + 3。 而 又 因为 我 们 没 在 SUBSTRING() 中 指定 抽取 长 度 ， 所 以 从 LOCATE() + 3 
直至 结尾 的 字符 ( 乌 种 的 学 名 ) 都 被 抽取 出 来 了 。 


POSITION() 与 LOCATE() 类 似 ， 但 它 不 用 逗号 来 区 分 子 串 和 整 串 ， 而 是 用 IN: 


POSITION(' - ' IN science_name) 


另外 ，LOCATE() 还 有 一 个 可 选 参数 ， 能 让 你 指定 从 哪个 位 置 开 始 搜索 ， 而 POSITION() 则 没 
有 这 个 功能 。 
FIND_IN_SET() 是 男 一 个 搜索 函数 。 如 果 你 有 一 个 内 部 用 逗号 分 段 的 字符 串 ， 就 可 以 用 
FIND_IN_SET() 来 查 出 哪 一 段 含 有 你 所 给 的 模式 。 为 了 更 好 地 理解 这 一 点 ， 假 设 我 们 有 一 
个 按 注册 日 期 排序 的 俄罗斯 用 户 列表 。 输 入 以 下 命令 : 

SELECT human_id, 

CONCAT(name_first, SPACE(1), name_last) AS Name， 

join_date 

FROM humans 


WHERE country_id = "ru' 
ORDER BY join_date; 
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+---------- +------------------- +------------ + 
| human id | Name | join_ date | 
+---------- +------------------- +------------ 十 
| 19 | ELena Bokova | 2011-05-21 | 
| 27 | Anahit Vanetsyan | 2011-10-01 | 
| 26 | Katerina Smirnova | 2012-02-01 | 
+------ +------------------- +------------ + 


从 这 个 列表 可 以 很 容易 就 看 出 ，Anahit Vanetsyan 是 第 二 位 注册 的 俄罗斯 用 户 。 那 是 因为 
这 个 列表 很 小 。 但 如 果 列 表 包 含 数 百 个 用 户 呢 ? 我 们 可 以 试 试 改 成 子 查询 并 配合 FIND_IN_ 
SET() 来 查找 : 


SELECT FIND_IN_SET('Anahit Vanetsyan', Names) AS Position 
FROM 
(SELECT GROUP_CONCAT(Name ORDER BY join_date) AS Names 
FROM 
( SELECT CONCAT(name_first, SPACE(1), name_last) AS Name， 
join_date 
FROM humans 
WHERE country_id = 'ru') 
AS derived_1 ) 
AS derived_2; 





+---------- + 
| Position | 
+---------- + 
| 2 | 
+---------- + 








这 条 SQL 语句 比较 复杂 。 最 里 层 的 SELECT 来 自 之 前 那个 ， 但 这 次 只 返回 全 名 和 注册 日 期 。 
然后 ， 我 们 将 该 SELECT 的 结果 送 给 GROUP_CONCAT， 这 会 产生 一 个 含有 所 有 名 字 且 很 长 的 字 
符 串 。 最 后 ， 最 外 层 的 SELECT 会 在 这 个 字符 串 中 查找 Anahit Vanetsyan 的 位 置 。 





将 子 查询 当成 提取 表 来 用 时 ， 必 须 用 As 给 它 起 一 个 别名 。 为 了 命名 简单 明 
了 ， 这 里 用 了 derived_1 和 derived_2。 一 般 来 说 ， 只 要 名 字 不 重复 就 行 。 














在 用 户 档案 的 页 面 显示 信息 时 ， 你 可 能 需要 这 种 SQL 语句 。 例 如 ， 显 示 用 户 在 某 些 排行 榜 
(如 发 现 次 数 最 多 ) 中 的 位 置 。 
如 果 找 不 到 子 串 ， 或 者 原 串 为 空 ， 则 FIND_IN_SET() 会 返回 0。 而 如 果 原 串 是 NULL， 则 
FIND_IN_SET() 会 返回 NULL 。 


10.3.2 ”字符 串 长 度 


有 时 你 可 能 会 想 知 道 一 个 字符 串 有 多 长 。MySQL 提供 了 一 些 能 返回 字符 串 长 度 的 函数 。 
你 可 以 在 调整 字符 串 格式 ， 或 对 字符 串 进 行 某 些 判断 时 ， 配 合 使 用 它们 。 事 实 上 ， 它 们 也 
经 常 被 拿 来 与 LOCATE() 和 SUBSTRING() 一 起 使 用 。 
































CHAR_LENGTH() 和 CHARACTER_LENGTH() 可 返回 一 个 字符 串 中 所 含 的 字符 数量 ， 能 用 于 查 出 
多 行 中 某 一 列 字 符 串 的 长 度 。 


例如 ， 假 设 我 们 准备 在 Rookery 网 站 上 展示 一 些 记录 在 bird_sightings 表 中 的 最 近 发 现 的 
鸟 。 显 示 内 容 包 括 俗名 、 学 名 等 鸟 种 信息 。 另 外 ， 我 们 还 打算 展示 用 户 发 现 鸟 时 所 写 的 评 
论 性 文字 。 不 过 ， 因 为 有 些 评 论 可 能 很 长 ， 所 以 我 们 想 先 检查 每 条 评论 的 长 度 。 如 果 遇 到 
长 评论 (超过 100 个 字符 )， 就 截 短 它 ， 并 给 出 一 个 超 链接 让 人 查看 完整 内 容 。 想 在 程序 
中 检查 字符 串 长 度 ， 可 以 这 样 写 : 

SELECT IF(CHAR_LENGTH(comments) > 100), 'long', 'short') 


FROM bird_sightings 
WHERE sighting_id = 2; 


此 处 用 了 CHAR_LENGTH() 来 检查 所 选 行 的 comments 列 的 长 度 ， 并 用 IF() 来 判断 该 长 度 是 否 


超过 100 个 字符 。 如 果 是 ， 则 返回 Long， 否 则 返回 short。 如 果 要 将 此 SQL 语句 用 在 API 
脚本 中 ， 可 动态 灰 换 WHERE 中 的 sighting_id， 以 得 知 每 次 发 现 的 评论 的 长 度 。 


CHAR_LENGTH() 判断 长 度 的 规则 ， 符 合 当 前 字符 集 (4.1 节 讲 过 字符 集 的 问题 ) 。 那 些 需 要 多 
个 字 节 保存 的 字符 (通常 来 自 亚 洲 语言 ) 也 会 被 当成 一 个 字符 来 统计 。 相 反 ，LENGTH() 则 
是 统计 字 节 。 注 意 ， 一 个 字 节 由 八 位 组 成 ， 而 西方 语言 通常 是 一 个 字母 占 一 个 字 节 。 如 果 
想 统 计 位 数 ， 可 用 BIT_LENGTH( ) 。 
比如 说 ， 我 们 发 现 bird_sightings 中 有 些 comments 包含 了 一 些 奇怪 的 二 进 制 字符 。 它 们 
可 能 是 会 员 使 用 移动 应 用 输入 的 。 为 了 找 出 哪些 行 含 有 这 样 的 字符 ， 以 便 删 掉 它们 ， 可 以 
用 以 下 SQL 语句 来 检测 |: 

SELECT sighting_id 


FROM bird_sightings 
WHERE CHARACTER_LENGTH(comments) != LENGTH(comments); 


此 SQL 语句 会 返回 comments 中 字符 数 与 字 市 数 不 一 致 的 sighting_id。 


10.3.3 比较 和 查找 字符 串 


上 一 小 节 试 过 将 CHAR_LENGTH() 的 输出 作为 IF() 的 输入 ， 以 决定 返回 什么 值 。 而 本 小 节 将 
介绍 一 些 比较 字符 串 的 函数 ， 它 们 也 很 适合 用 在 IF() 和 WHERE 之 中 。 


先 设想 一 个 需要 这 些 函 数 的 场景 一 一 准确 地 说 ， 是 需要 使 用 STRCMP() 的 场景 。 很 多 程序 员 
都 喜欢 该 函数 的 名 字 ， 它 是 string compare (字符 串 对 比 ) 的 缩写 。 


电子 邮件 是 我 们 与 会 员 联 系 的 重要 方式 ， 所 以 ， 我 们 决定 要 求 新 加 入 的 会 员 在 注册 时 输入 
两 次 电子 邮件 地 址 ， 以 确保 填写 正确 。 为 了 防止 在 这 个 过 程 中 网 络 连接 中 断 ， 或 者 新 加 入 
J 会 员 没 有 修正 地 址 中 的 错误 ， 我 们 需要 有 个 表 来 保留 这 两 个 地 址 ， 直 至 他 们 修正 。 注 册 
时 ， 无论 他 们 输入 得 是 否 正确 ， 都 先 记 入 humans 表 ， 然 后 在 另 一 个 表 里 将 两 个 电子 邮件 地 
址 记录 下 来 ， 以 做 后 续 对 比 。 而 对 比 的 做 法 ， 就 是 用 STRCMP()。 


这 种 对 比 操作 一 般 会 用 其 他 API (用 于 与 MySQL/MariaDB 交互 的 程序 ) 来 执行 。 我 们 
会 在 该 程序 中 写 好 用 于 检查 邮件 地 址 的 SQL 语句 。 不 过 ， 一 开始 我 们 得 先 创建 一 个 保存 
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human_id 和 两 个 电子 邮件 地 址 的 表 ， 如 下 : 


CREATE TABLE possible _ duplicate email 
(human_id INT， 

email_address1 VARCHAR(255), 
email_address2 VARCHAR(255), 
entry_date datetime ); 


这 样 ， 当 新 用 户 的 信息 被 保存 到 humans 中 之 后 ， 我 们 的 程序 就 会 选择 性 地 保存 该 用 户 的 两 
个 电子 邮件 地 址 到 possible_duplicate_email 中 。 该 选择 性 程序 可 能 如 下 : 

INSERT IGNORE INTO possible duplicate email 

(human_id, email_address_1, email _address 2, entry_date) 


VALUES(LAST_INSERT_ID(), 'bobyfischer@mymail.com', 'bobbyfischer@mymail.com') 
WHERE ABS( STRCMP('bobbyrobin@mymail.com', 'bobyrobin@mymail.com') )=1; 


在 上 面 的 语句 中 ， 我 直接 写 出 了 邮件 地 址 。 不 过 在 现实 环境 中 ， 这 种 SQL 语句 可 能 是 向 在 
PHP 脚本 里 的 ， 而 邮件 地 址 会 用 变量 给 出 (例如 $email_1 和 $email_2)。 


WHERE 中 的 STRCMP() 会 在 两 个 邮件 地 址 一 致 时 返回 0。 如 果 不 一 致 ， 则 会 返回 1 或 -1。-1 
是 指 第 一 个 值 的 字母 序 先 于 第 二 个 值 。 为 了 应 付 这 种 情况 ， 我 们 加 了 ABS() 函数 ， 以 获 
取 STRCMP() 结果 的 绝对 值 。 于 是 ， 当 两 个 邮件 地 址 不 一 致 时 ， 它 们 就 会 被 插入 possible_ 
duplicate_email， 以 便 管理 员 翻 查 。 顺 便 说 一 下 ， 该 语句 会 报错 ， 但 IGNORE 会 令 MySQL 
忽略 报错 信息 。 


另 一 个 比较 函数 是 MATCH() AGAINST()， 可 用 于 查找 出 匹配 的 行 。 它 甚至 可 以 根据 相关 性 来 
对 每 一 行进 行 排名 ， 但 这 已 经 超出 本 章 的 范围 了 。 它 只 能 在 有 FULLTEXT 索引 的 列 上 使 用 。 
为 了 试用 该 函数 ， 我 们 先 在 bird_sightings 表 的 comments 列 上 加 FULLTEXT 索引 (因为 该 
列 是 TEXT 类 型 ) : 


CREATE FULLTEXT INDEX comment_index 
ON bird_sightings (comments); 


这 样 就 可 以 用 MATCH() AGAINST() 了。 通常 我 们 会 把 它 作 为 条 件 写 在 WHERE 中 ， 以 找 出 含 
有 给 定 字符 串 的 列 。 给 定 字符 串 的 内 容 会 根据 空格 和 引号 分 词 。 其 中 ， 小 词 ( 少 于 或 等 于 
三 个 字符 的 词 ) 一 般 会 被 忽略 。 以 下 是 例子 : 


SELECT CONCAT(name_first, SPACE(1), name_last) AS Name， 
common_name AS Bird, 

SUBSTRING(comments, 1, 25) AS Comments 

FROM birdwatchers.bird_sightings 

JOIN birdwatchers.humans USING(human_id) 

JOIN rookery.birds USING(bird_id) 

WHERE MATCH (comments) AGAINST ('beautiful'); 






























































TI 
























































+------------------- +----------------- +--------------------------- 十 
| Name | Bird | Comments | 
+------------------- +----------------- +--------------------------- 十 
| ELena Bokova | Eskimo Curlew | It was amajor effort get | 
| Katerina Smirnova | Eurasian Curlew | Such a beautiful bird. I | 
+------------------- +----------------- +--------------------------- 十 





在 此 WHERE 中 ， 我 们 可 以 用 字符 串 beautiful 与 comments 列 进行 配对 。 对 于 匹配 的 ， 
该 列 以 及 另外 三 列 : rookery.birds 的 common_name， 以 及 birdwatchers.humans 上 name_ 
first 和 name_Last。 


我 们 还 用 了 SUBSTRING() 来 限制 返回 内 容 的 长 度 〈 即 截 短 内 容 )。 你 可 以 再 用 CONCAT() 拼 
接 一 些 括 号 ， 以 暗示 还 有 一 些 文字 没 显示 。 还 可 以 用 IF() 来 判断 是 否 还 有 更 多 内 容 ， 以 
决定 是 否 加 括号 。 如 需 查 出 beautiful 在 原文 中 的 位 置 ， 并 只 显示 该 位 置 前 后 的 文本 ， 
MySQL 也 有 其 他 函数 可 以 做 到 。 这 个 我 们 会 在 本 童 后 面 讲 到 。 


10.3.4 在 字符 串 中 蔡 换 或 插入 内 容 


如 果 想 在 字符 串 中 插入 或 替换 一 些 内 容 〈 并 不 是 替换 全 部 )， 可 以 使 用 INSERT() 函数 。 别 
把 它 和 INSERT 语句 搞 混 了 。 它 的 语法 如 下 : 首先 指明 等 插入 内 容 的 字符 串 或 列 ， 然 后 指明 
插入 的 位 置 。 也 可 以 指定 想 删除 多 少 内 容 。 最 后 是 要 插入 的 内 容 。 下 面 来 看 例子 。 


先 看 一 个 简单 的 例子 。 假 设 我 们 想 在 Rookery 网 站 的 页 面 上 ， 给 鸟 种 俗名 中 的 Least 加 上 
注释 Smallest， 以 让 那些 不 太 懂 行 的 观 鸟 者 知道 Least 的 意思 是 “最 小 ”， 而 韭 “最 次 要 ”。 
做 法 如 下 : 

SELECT INSERT(common_name, 6, 0, ' (i.e., Smallest)') 

AS 'Smallest Birds' 


FROM birds 
WHERE common_name LIKE 'Least %' LIMIT 1; 
























































+- + 
| Smallest Birds | 
4 + 
| Least (i.e., Smallest) Grebe | 
+- + 


第 一 个 参数 就 是 我 们 要 修改 的 列 。 第 二 个 就 是 插入 的 起 始 位 置 。 而 根据 WHERE 条 件 ， 我 们 
查 的 是 俗名 以 Least 开头 的 鸟 。 因为 J Least 是 5 个 字符 ， 所 以 我 们 还 要 加 1， 使 插入 的 内 容 
放 在 Least 后 的 空格 之 后 。 第 三 个 参数 是 指 起 始 位 置 之 后 有 多 少 个 字符 应 被 奉 换 。 不 过 我 
们 现在 只 插入 而 不 替换 。 


INSERT() 的 效果 体现 在 结果 集中 ， 它 不 会 更 改 表 中 的 数据 。 我 们 大 可 用 INSERT() 来 改变 俗 
名 的 格式 ， 让 那些 自 认为 是 观 鸟 新 手 的 用 户 在 头 一 个 月 熟悉 各 种 鸟 名 。 要 想 编写 查找 新 手 
的 SQL 语句 ， 就 要 再 复杂 一 些 了 。 因 为 我 们 这 里 只 讲解 INSERT() 的 用 法 ， 所 以 就 不 写 了 。 
现在 来 看 看 如 何 用 INSERT() 替换 字符 串 中 的 数据 。 


假设 我 们 发 现 birds 表 中 有 些 鸟 的 俗名 含有 缩写 (比如 ， 将 Great 缩写 成 Gt. 了 )。 现 在 我 
们 打算 用 INSERT() 把 缩写 词 扩展 回去 。 在 修改 数据 之 前 ， 先 用 SELECT 来 看 看 INSERT() 写 
得 是 否 正确 : 

SELECT common_name AS Original, 

INSERT(common_name, LOCATE('Gt.', common_name), 3, 'Great') AS Adjusted 


FROM birds 
WHERE common_name REGEXP 'Gt.' LIMIT 1; 
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+------------------ +-------------------- + 
| Original | Adjusted | 
+------------------ +-------------------- 十 
| Gt. Reed-Warbler | Great Reed-Warbler | 
+------------------ +-------------------- + 


我 们 已 在 之 前 的 例子 中 回顾 了 INSERT() 各 个 参数 的 意义 。 而 本 例 有 新 意 的 地 方 ， 就 





个 参数 使 用 了 LOCATE()。 它 的 目的 是 查 出 待 殖 换 文本 所 厂 





月 .和 


契 宙 一 


E 的 位 置 。 之 前 的 例子 假设 Least 


只 会 出 现在 开头 。 但 本 例 则 不 这 样 猪 测 Gt. 的 位 置 ， 相 反 ， 我 们 用 函数 来 查找 其 位 置 。 
本 例 的 另 一 个 不 同 之 处 ， 就 是 第 三 个 参数 : 我 们 告诉 这 个 函数 ， 把 Gt 的 起 始 位 置 往 后 的 





三 个 字符 〈 即 Gt 的 长 度 )， 替 换 成 Great (由 第 四 个 参数 指定 )。 





串 ， 但 该 列 还 是 有 足够 的 空间 容纳 。 


尽管 用 于 替换 的 串 长 于 原 


如 果 LOCATE() 没 找到 Gt.， 那 么 就 会 返回 0。 而 0 作为 INSERT() 的 第 二 个 参数 时 ， 将 使 
INSERT() 直接 返回 原 内 容 。 所 以 ， 我 们 没 必 要 用 WHERE 来 第 选 出 含 Gt 的 行 一 一 除非 你 仅 








想 显示 这 些 行 。 


既然 已 经 确认 此 INSERT() 疫 问 题 ， 那 么 就 可 以 开始 修改 数据 了 : 


UPDATE birds 


SET common_name = INSERT(common_name, LOCATE('Gt.', common_name), 3, 'Great') 


WHERE Common_name REGEXP 'Gt.'; 


除了 用 INSERT()， 我 们 还 有 其 他 方法 来 杰 换 字符 




















SELECT 来 测试 : 


SELECT common_name AS Original, 
REPLACE(common_name, 'Gt.', 'Great') AS RepLaced 
FROM birds 

WHERE common_name REGEXP 'Gt.' LIMIT 1; 


+------------------ +-------------------- + 
| Original | Replaced | 
+------------------ +-------------------- + 
| Gt. Reed-Warbler | Great Reed-Warbler | 
+------------------ +-------------------- + 





7 














数据 更 改 : 


UPDATE birds 


和 。 使 用 INSERT() 时 ， 必 须 带 上 
LOCATE()， 以 决定 在 哪里 进行 赫 换 ， 并 且 ， 还 得 指明 替换 多 少 个 字符 。 而 使 用 REPLACE() 
的 话 ， 就 简单 了 。 我 们 可 以 用 它 来 将 common_name 中 所 有 的 Gt. 替换 成 Great。 下 面 就 用 





SET common_name = REPLACE(common_name, 'Gt.', 'Great'); 


Query OK, 8 rows affected (0.23 sec) 
Rows matched: 28891 Changed: 8 Warnings: 0 


注意 ， 我 们 没有 带 上 WHERE， 但 结果 还 是 只 修改 了 八条 








SELECT 视 测 这 些 参 数 。 

















下 面 这 种 做 法 更 好 。 我 们 可 以 用 带 着 这 些 参数 的 REPLACE( )， 并 且 输 入 以 下 UPDATE 来 实施 


。 那 是 因为 只 有 这 八 行 的 common_ 
name 含有 Gt.。 更 新 含有 多 行 数据 的 表 时 ， 不 加 WHERE 是 很 危险 的 ， 所 以 最 好 还 是 先 用 





10.4 转换 字符 串 类 型 


很 多 时 候 ， 我 们 都 会 遇 到 一 些 他 人 没有 定义 好 数据 类 型 的 表 。 有 时 ， 你 可 以 改 表 结 构 ， 但 
有 时 不 被 允许 这 么 做 。 面 对 这 样 的 表 ， 可 以 使 用 CAST() 或 CONVERT() 函数 来 改变 列 的 数据 
类 型 。 这 两 个 函数 只 影响 结果 集 ， 不 会 更 改 原 数 据 。 其 实 它们 基本 上 是 一 样 的 ， 只 是 语法 
有 些许 差异 。 接 下 来 ， 我 们 会 拿 一 些 例子 来 看 看 如 何以 及 为 何 要 使 用 它们 。 


假设 我 们 有 一 个 用 于 保存 鸟 种 图 像 信 息 的 表 ， 从 那些 图 像 可 看 出 每 种 鸟 肉 性 、 雄 性 和 幼年 
的 颜色 。 该 表 有 一 列 是 图 像 的 序号 ， 它 是 根据 鸟 种 和 拍摄 日 期 而 定 的 。 不 过 该 列 没 用 INT 
型 ， 而 用 了 CHAR。 如 果 以 该 列 来 给 数据 排序 的 话 ，MySQL 就 会 按 词 法 序 来 排 ， 而 不 是 按 
数字 序 ， 如 下 所 示 : 

SELECT sorting_id, bird_name, bird_image 


FROM bird_images 
ORDER BY sorting_id 
































LIMIT 5; 

+----- +----------------- +---------------------------- 十 
| sorting_id | bird_name | bird_image | 
+----- +----------------- +---------------------------- + 
| 11 | Arctic Loon | artic_loon_male.jpg | 
| 111 | Wilson's Plover | wilson_ plover_male.jpg | 
| 112 | Wilson's Plover | wilson plover female.jpg | 
| 113 | Wilson's Plover | wilson_plover_juvenile.jpg | 
| 12 | Pacific Loon | pacific loon_male.jpg | 
+----- +----------------- +---------------------------- + 


注意 ， 所 有 sorting_id 为 11 开头 的 行 ， 都 被 排 在 12 的 前 面 了 。 因 为 MySQL 将 它们 当成 
了 字符 ， 而 非 数字 。 如 果 排 序 正 确 ， 那 两 个 Loon 应 该 是 在 一 起 的 ， 并 且 排 在 Plover 之 前 。 


我 们 可 以 用 CAST() 将 sorting_id 的 值 换 成 INT 类 型 : 


SELECT sorting_id, bird_name, bird_image 
FROM bird_images ORDER BY CAST(sorting_id AS INT) LIMIT 5; 




















+---- +----------------- +---------------------------- 十 
| sorting_id | bird_name | bird_image | 
+---- +----------------- +---------------------------- 十 
| 11 | Arctic Loon | artic_loon_male.jpg | 
| 12 | Pacific Loon | pacific _ loon _male.jpg | 
| 111 | Wilson's Plover | wilson_ plover_male.jpg | 
| 112 | Wilson's Plover | wilson plover female.jpg | 
| 113 | Wilson's Plover | wilson plover_juvenile.jpg | 
+----- +----------------- +---------------------------- 十 


现在 排序 正确 了 。 再 假设 我 们 不 想 按 sorting_id 排 了 ， 而 想 按 gender_age 排 。 该 列 是 
ENUM 型 的 ， 可 选 male、female 或 juventte。 鸟 的 颜色 类 型 主要 因 这 三 个 因素 而 异 。 如 果 
按 这 列 来 排序 的 话 ， 结 果 如 下 : 

SELECT bird_name, gender_age, bird_image 


FROM bird_images 
WHERE bird_name LIKE '%Plover%' 




















ORDER BY gender_age 


LIMIT 5; 

+----------------- +------------ +---------------------------- 十 
| bird_nanme | gender_age | bird image 
+----------------- +------------ +- + 
| Wilson's Plover | male | wilson_plover_male.jpg 

| Snowy Plover | male | snowy_plover_male.jpg 

| Wilson's Plover | female | wilson_plover_female.jpg | 
| Snowy Plover | female | snowy_plover_female.jpg 

| Wilson's Plover | juvenile | wilson_plover_juvenile.jpg | 
+----------------- +------------ +- + 


可 看 出 它们 按 gender_age 归 类 了 ， 但 顺序 不 是 字母 序 (female 本 应 在 male 之 前 ) ， 而 是 按 
每 个 枚 举 值 定义 的 顺序 : 


SHOW COLUMNS FROM bird images LIKE 'gender_age' \G 

















炎 兴 兴 类 火光 天 类 类 光 尖 火炎 类 火光 类 天 类 类 类 火炎 类 类 类 大 了 row 炎 兴 光 火光 兴 尖 类 光 兴 火炎 天 炎炎 天 天 天 类 天 炎炎 类 类 类 天 天 
FieLd: gender_age 
Type: enum('male','female','juvenile') 
NULL: YES 
Key : 
Default: NULL 
Extra: 


这 样 ， 对 MySQL 来 说 ，male 就 是 1，female 就 是 2， 所 以 结果 集中 ，male 排 在 female 之 
前 ， 尽 管 字母 序 不 是 这 样 。 为 了 修正 ， 可 以 在 ORDER BY 中 用 CAST() 或 CONVERT()， 这 样 
MySQL 就 会 根据 函数 的 返回 值 ， 而 不 是 列 的 原 值 来 排 。 具 体 如 下 : 

SELECT bird_name, gender_age, bird_image 

FROM bird_images 


WHERE bird_name LIKE '%Plover%" 
ORDER BY CONVERT(gender_age, CHAR) 





让 











LIMIT 5; 

+----------------- +------------ +---------------------------- + 
| bird_nanme | gender _age | bird image 
+----------------- +------------ +- + 
| Wilson's Plover | female | wilson_plover_female.jpg | 
| Snowy Plover | female | snowy_plover_female.jpg 

| Wilson's Plover | juvenile | wilson_plover_juvenile.jpg | 
| Snowy Plover | juvenile | snowy_plover_juvenile.jpg | 
| Wilson's Plover | male | wilson_plover_male.jpg 
+----------------- +------------ +---------------------------- + 


注意 ， 在 CONVERT() 中 ， 我 们 不 是 用 As 来 分 隔 原 值 和 新 类 型 ， 而 是 用 逗号 。 第 二 个 参数 
的 新 类 型 可 以 是 BINARY、CHAR、DATE、DATETIME、SIGNED [INTEGER]、TIME 或 UNSIGNED 
[INTEGER]。 其 中 ，BINARY 会 将 字符 串 转 换 成 二 进 制 串 。 你 也 可 以 加 上 CHARACTER SET， 以 
进行 字符 集 转换 。 要 转换 给 定 字符 串 的 字符 集 ， 需 要 使 用 USING 选项 ， 如 下 : 


SELECT bird_name，gender_age，bird_image 
FROM bird_images 











WHERE bird_name LIKE “'%PLover% 
ORDER BY CONVERT(gender_age USING utf8) 


LIMIT 5; 


10.5 “压缩 字符 串 


有 些 列 类 型 可 包含 大 量 数据 ， 例 如 BLOB。 为 了 减少 使 用 了 这 种 类 型 的 表 的 占用 空间 ， 可 
以 在 插入 数据 时 ， 先 对 数据 进行 压缩 。 压 缩 用 COMPRESS()， 解 压缩 用 UNCOMPRESS()。 要 
使 用 这 两 个 国 数 ， 必 须 让 MySQL 安装 时 带 上 压缩 库 ( 即 ztib)。 如 果 没 有 的 话 ， 使 用 





COMPRESS() 时 就 会 返回 NULL。 现 在 来 看 一 些 例子 。 





humans 表 中 有 一 列 叫 bir 
观 鸟 经 验 的 内 容 ， 最 终 这 
查询 和 更 新 变 慢 。 所 以 我 
做 法 如 下 : 


INSERT INTO humans 




















ding_background， 它 是 BLOB 型 。 会 员 可 在 其 中 填写 任何 关于 其 
些 信息 会 在 网 上 显示 。 如 果 很 多 人 同时 填写 的 话 ， 那 有 可 能 导致 
们 决定 ， 在 往 humans 表 插 入 这 些 信息 前 ， 先 用 COMPRESS() 压缩 。 








(formal_title, name_first, name_last, join date, birding_background) 


VALUES('Ms', 'Meliss 


此 SQL 语句 会 把 一 个 新 月 
这 个 例子 ， 就 先 写 这 么 多 








枉 


a', 'Lee', CURDATE(), COMPRESS("lengthy background...")); 


目 户 的 信息 录 到 humans 表 中 一 一 该 表 还 有 很 多 列 ， 不 过 为 了 简化 
。 它 用 了 COMPRESS() 来 将 背景 信息 压缩 (虽然 本 例 中 的 背景 信息 




















过 
不 是 很 长 )。 背 景 信息 可 以 来 自 网 页 的 用 户 输入 ， 然 后 保存 在 其 他 API 程序 (如 PHP) 的 
变量 中 (如 $birding_background)， 再 传 给 SQL 语句 。 














想 看 压缩 后 的 样子 ， 可 这 样 查询 : 


SELECT birding_background AS Background 





FROM humans 
WHERE name_first = " 


Melissa' AND name_Last = 'Lee' \G 


类 淡淡 火 火 淡淡 大 类 炎炎 淡淡 火 火 火炎 类 类 炎炎 汪汪 火炎 火炎 1. row 类 淡淡 炎炎 淡淡 火炎 火炎 火炎 炎炎 淡淡 火炎 火炎 类 类 炎炎 炎炎 


Background: X#######/ 许 THJL##/######### 间 世间 ######### 


注意 ， 它 看 起 来 不 像 平 常 的 文本 。 那 是 因为 mysql 将 二 进 制 值 换 成 了 #。 要 想 看 原本 的 内 


容 ， 可 用 UNCOMPRESS()。 
译 ， 则 它 会 返回 NULL: 


























如 果 存 储 的 值 是 没 压缩 过 的 ， 或 MySQL 没有 带 上 zlib 一 起 编 


SELECT UNCOMPRESS(birding_background) AS Background 


FROM humans 
WHERE name_first = " 


Melissa' AND name_Last = 'Lee' \G 


炎 兴 兴 火 火光 光 光 淡淡 炎炎 类 火炎 火炎 炎炎 类 大 大 大 火炎 大 大 y row 类 淡淡 炎炎 淡淡 淡淡 火 火 火炎 炎炎 淡淡 火炎 火炎 类 炎炎 炎炎 火 


Background: lengthy 


background... 


对 于 这 种 少量 的 文本 ， 压 缩 后 比 压缩 前 更 费 空间 。 但 对 于 大 量 文本 ， 则 会 节省 空间 。 所 


以 ， 请 谨慎 使 用 压缩 函数 





o 





10.6 小结 


MySQL 和 MariaDB 其 实 还 有 更 多 可 用 的 字符 串 函 数 。 其 中 有 些 是 这 里 提 到 的 一 些 函 数 的 
别名 或 功能 类 似 的 替代 品 。 有 些 是 能 将 字符 串 在 ASCI、 二 进 制 、 十 六 进 制 和 八进制 之 间 
转换 的 函数 。 还 有 些 是 我 们 未 提 及 的 加 密 和 解密 函数 。 不 过 ， 我 认为 本 章 已 经 将 最 常用 的 
都 介绍 完了 ， 它 们 足以 助 你 构建 出 更 强大 的 SQL 语句 ， 生 成 更 炫 的 样式 。 


10.7 习题 


对 于 开发 MySQL 和 MariaDB 的 数据 库 来 说 ， 字 符 串 函数 非常 重要 。 你 应 该 很 好 地 掌握 它 


们 。 


(1) 


2) 


(3) 


(4) 























要 想 成 为 这 类 函数 的 专家 ， 得 多 加 练习 。 所 以 ， 请 确保 完成 以 下 习题 。 


CONCAT() 是 最 常用 的 字符 串 国 数 之 一 。 构 建 一 条 查询 humans 表 的 SELECT 语句 。 用 
CONCAT() 将 name_first 与 name_Last 拼接 在 一 起 ， 并 用 SPACE() 在 两 者 之 间 加 空格 。 为 
结果 取 别 名 FuLL Name 一 一 记得 定义 这 个 别名 时 要 加 引号 ， 因 为 它 包 含 空 格 。 只 查 四 行 ， 
并 确保 运行 正常。 

给 SELECT 加 一 个 WHERE 子 句 ， 并 在 其 中 复制 刚才 所 写 的 CONCAT()， 以 限定 只 查 出 这 些 
人 : Lexi Hollar、Michael Zabalaoui 和 Rusty Johnson。 

上 面 运行 没 问题 的 话 ， 再 加 一 个 ORDER BY， 使 结果 集 按 拼接 后 的 名 字 排 序 。 不 能 用 到 
CONCAT( ) 。 

构建 一 条 SELECT 语句 ， 查 询 birds 表 的 common_name 和 scientific_name。 用 字符 串 函 
数 将 scientific_name 改 成 全 部 小 写 。 再 使 用 CONCAT() 将 它们 拼接 成 一 个 域 ， 格 式 是 
俗名 后 留 一 个 空格 ， 接 着 是 加 括号 的 学 名 ， 如 African Desert Warbler (sylvia deserti)。 空 
格 不 要 用 SPACE()。 空 格 和 括号 都 用 单 引 号 包围 ， 拼 进 CONCAT() 中 。 拼 接 后 ， 起 别名 为 
Bird Species。 将 结果 限制 为 10 行 。 

执行 成 功 后 ， 将 这 条 SQL 语句 改 成 与 btrd_famiLies 和 bird_orders 连接 。 可 到 9.2 节 
中 参考 JOIN 的 用 法 。 最 终结 果 要 包含 这 些 表 的 scientific_name。 

确认 可 以 运行 后 ， 将 新 加 的 两 个 表 的 scientific_name 移 到 CONCAT() 中 。 使 用 RPAD() 
在 种 名 后 ， 科 名 和 目 名 前 ， 添 加 一 些 句点 。 类 似 这 样 : 


Speckled Warbler (pyrrhoLaemus sagittatus)...Acanthizidae...Passeriformes 


你 可 能 会 需要 使 用 两 次 CONCAT()。 最 后 ， 再 用 WHERE 选 出 Warbler 的 那些 行 ， 并 只 显示 
10 行 。 

再 构建 一 条 SELECT 语句 ， 查 出 所 有 俗名 含 Shrike 的 鸟 种 。 你 会 在 结果 中 看 到 有 些 
Shrike 带 有 横 枉 。 用 REPLACE() 将 横 杠 赫 换 成 空格 ， 然 后 再 执行 一 次 。 

刚才 那个 习题 还 会 查 出 一 些 名 字 带 有 两 个 横 杠 的 鸟 (例如 Yellow-browed Shrike- 
Vireo)。 重 做 该 习题 ， 使 只 有 Shrike 后 的 横 杠 被 替换 【例如 Yellow-browed Shrike 
Vireo)。 要 做 到 这 种 效果 ， 用 LOCATE() 配合 REPLACE()。LOCATE() 要 写 两 次 ， 一 个 
LOCATE 包含 另 一 个 。 




































































































































































(5) Laniidae 科 的 Shrike， 才 是 真 的 Shrike。 构 建 一 条 SELECT 语句 ， 搜 索 俗 名 含有 Shrike 
并 且 属 于 Laniidae 的 鸟 。 你 会 需要 连接 bird_families 表 。 然 后 ， 使 用 某 个 抽取 字符 
串 的 函数 ， 如 SUBSTRING()， 将 Shrike 前 的 词 抽 取出 来 。 这 需要 LOCATE() 之 类 的 函数 

配合 。 接 着 ， 将 截 出 的 词 放 到 Shrike 后 面 ， 用 逗号 和 空格 阳 开 。 结 果 应 该 会 变 成 这 样 : 

Shrike，Rufous-tailed。 给 该 域 起 别名 为 Shrikes。 

(6) 在 humans 表 里 ， 会 员 输入 的 姓名 有 大 写 的 ， 也 有 小 写 的 (例如 andy oram 和 MICHAEL 
STONE)。 用 UPDATE 将 它们 改 成 标题 样式 ( 即 首 字母 大 写 ， 其 余 小 写 )。 先 用 SELECT 测 
试 函 数组 合 得 是 否 正确 。 更 改 大 小 写 ， 你 会 用 到 UCASE() 和 LCASE()。 还 会 多 次 使 用 
SUBSTRING() 之 类 的 函数 ， 偶 尔 还 会 用 到 CONCAT()。 
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小 


日 斯 和 时 间 遂 数 





大 多 数 人 都 将 每 天 分 为 上 午 和 下 午 ， 而 将 两 个 12 小 时 或 一 个 24 小 时 当成 一 天 。 一 年 有 12 
个 月 ， 除 了 其 中 一 个 月 份 只 有 28 天 (不 过 每 四 年 它 会 变 成 29 天)， 其 他 月 份 都 有 30 天 或 
31 天 。 这 对 于 人 类 来 说 是 很 自然 的 事 ， 或 者 至 少 是 很 熟悉 的 事 。 但 对 于 计算 机 来 说 ， 却 不 
是 这 样 。 然 而 ， 在 数据 库 中 存储 并 操作 日 期 和 时 间 又 是 一 个 很 常见 的 需求 。 


要 在 数据 库 中 存储 日 期 和 时 间 (即时 间 型 数据 )， 你 得 了 解 在 表 里 有 什么 列 类 型 可 用 。 更 
重要 的 是 ， 要 了 解 如 何 把 时 序数 据 存 进 数 据 库 ， 以 及 如 何以 其 他 格式 获取 数据 。 虽 然 这 上 听 
起 来 很 简单 ， 但 MySQL 和 MariaDB 提供 了 很 多 内 置 时 间 函 数 ， 能 让 你 把 SQL 语句 构建 
得 更 准确 ， 把 数据 格式 化 得 更 美观 。 在 本 章 中 ， 我 们 来 探讨 这 些 函 数 。 


11.1 日 期 和 时 间 的 数据 类 型 


因为 日 期 和 时 间 不 过 是 包含 数字 的 字符 串 ， 所 以 可 用 普通 的 字符 型 来 存储 。 然 而 ， 我 们 有 
专 为 日 期 和 时 间 而 设计 的 数据 类 型 。 如 果 将 日 期 和 时 间 保 存 为 这 样 的 类 型 ， 我 们 就 可 以 利 
用 一 些 内 置 函数 来 操作 它们 。 所 以 ， 在 学习 这 些 函 数 之 前 ， 让 我 们 先 看 看 有 些 什么 日 期 和 
时 间 类 型 。 


MySQL 和 MariaDB 有 五 种 时 间 型 数据 : 存储 日 期 的 DATE， 存 储 时 间 的 TIME， 将 日 期 和 时 

间 一 起 存储 的 DATETIME 和 TIMESTAMP， 以 及 存储 年 份 的 YEAR。 

。 DATE 
它 只 保存 日 期 ， 格 式 为 yyyy-mm-dd。 你 可 能 更 喜欢 其 他 格式 (例如 ， 将 情人 节 显 示 
成 02-14-2014)， 但 DATE 的 存储 方式 不 可 改变 至 少 ， 无 法 在 不 改变 MySQL 源 代 
码 的 情况 下 ， 改 变 其 存储 方式 。 如 果 想 按 其 他 格式 来 显示 日 期 ， 可 以 用 本 章 介 绍 的 其 
他 函数 。 
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DATE 对 其 可 接受 的 日 期 范围 有 限制 ， 即 1060-01-91 至 9999-12-31。 这 足以 保存 很 久 以 
后 的 日 期 ， 虽 然 它 不 能 用 来 保存 第 一 个 千年 里 的 日 期 。 

TIME 

它 能 将 时 间 按 hhh:mm:ss 的 格式 保存 。 可 接受 的 时 间 范 围 是 -838:59:59 至 838:59:59。 
如 果 你 给 的 数据 超出 了 该 范围 ， 或 者 给 的 是 无 效 数 据 ， 那 么 它 会 全 部 被 保存 成 0。 

你 可 能 会 想 不 通 为 何 需要 三 位 数 来 表示 小 时 。 其 实 那 是 为 了 方便 表示 一 件 事情 的 持续 时 
间 ， 或 对 比 两 个 时 间 ， 而 不 只 是 保存 一 天 中 的 某 个 时 间 。 例 如 ， 当 你 想 记录 “ 某 件 事 花 
了 120 个 小 时 ”时 ， 可 以 用 两 列 ， 一 列 记录 开始 时 间 ， 另 一 列 记 录 结 束 时 间 ， 然 后 两 者 
相 减 。 实 际 上 TIME 可 以 让 你 直接 保存 这 个 结果 ， 而 不 需 在 每 次 查询 时 重新 计算 。 
DATETIME 

它 能 将 日 期 和 时 间 保 存在 一 起 ， 格 式 为 yyyy-mm-dd hh:mm:ss。 可 接受 的 日 期 和 时 间 范 
围 是 1000-01-01 00:00:00 至 9999-12-31 23:59:59。 其 中 日 期 的 范围 与 DATE 一 样 ， 而 
时 间 则 是 24 小 时 。 在 MySQL 5.6 版 本 中 ， 其 至 可 以 比 秒 更 精确 。 

TIMESTAMP 

它 与 DATETIME 类 似 ， 但 范围 更 有 限 。 虽 然 名 字 中 有 TIME， 但 却 不 是 说 在 一 天 的 某 个 
时 间 段 上 有 限制 ， 而 是 在 日 期 上 ， 它 只 能 保存 1970-91-0100:00:01 UTC 至 2038-01-19 
03:14:07 UTC 之 间 的 日 期 和 时 间 。 这 适用 于 从 Unix 时 间 惟 到 我 们 现在 这 个 时 代 的 时 间 。 
而 在 MySQL 5.6 版 本 中 ， 甚 至 可 以 比 秒 更 精确 。 

当 列 被 定 为 这 种 类 型 时 ， 除 了 手动 给 其 录入 或 更 新 日 期 和 时 间 ， 也 可 以 让 MySQL 自动 
为 你 录入 或 更 新 为 当前 日 期 和 时 间 。 这 对 于 日 志 程 序 之 类 的 应 用 来 说 ， 十 分 方便 。 但 
注意 ， 一 般 能 自动 录入 的 只 有 表 中 的 第 一 个 TIMESTAMP 列 ， 如 果 想 让 其 他 TIMESTAMP 
列 也 获得 同样 效果 ， 需 要 设 定 ON _ UPDATE CURRENT_TIMESTAMP 和 ON INSERT CURRENT_ 
TIMESTAMP 。 



























































YEAR 

它 只 保存 年 份 ， 格 式 为 yyyy。 你 也 可 以 将 它 设 为 只 保存 两 位 数 (YEAR(2))。 不 过 这 会 
导致 一 些 问题 ， 所 以 不 推荐 这 么 做 。 

它 也 可 以 表示 人 的 出 生年 份 ， 可 接受 的 范围 是 1991 至 2155。 如 果 给 的 值 无 效 或 超出 该 
范围 ， 则 会 被 保存 成 006。 


因为 有 以 上 这 些 限制 ， 所 以 当 需 要 存储 超出 范围 的 日 期 时 ， 你 可 能 要 用 到 
非 时 间 型 的 列 类 型 。 例 如 ， 可 将 年 月 日 拆 成 三 个 INT 列 来 存储 ， 或 者 合 在 一 
起 ,保存 成 固定 格式 的 CHAR， 又 或 者 是 月 和 日 用 INT， 年 用 CHAR(4) (这 样 
就 可 以 解决 YEAR 不 能 保存 20 世纪 之 前 年 份 的 问题 ) 。 

一 般 来 说 这 样 是 没 问题 的 ， 但 如 果 要 进行 日 期 计算 ， 就 麻烦 了 。 假 设 你 用 两 
个 INT 列 保存 2 月 15 日 : 2 放 在 my_month，15 放 在 my_day。 然 后 ， 你 想 给 
该 日 期 加 20 天 。 但 直接 加 的 话 ， 就 会 得 出 2 月 35 日 这 样 的 无 效 日 期 。 如 此 
一 来 ， 你 得 写 一 个 很 复杂 的 日 期 判断 逻辑 (还 要 考虑 年 份 的 变动 )。 同 样 ， 
用 INT 保存 时 间 也 会 遇 到 这 种 状况 。 而 用 时 间 型 ， 再 配合 MySQL 的 日 期 和 
时 间 函 数 ， 则 无 需 担心 这 个 问题 ， 因 为 这 些 函 数 已 封装 了 那些 复杂 的 计算 。 






















































































154 | 第 11 章 


熟悉 过 这 些 类 型 并 知道 了 它们 的 优点 之 后 ， 就 可 以 看 一 些 例子 ， 学 习 怎 样 用 日 期 和 时 间 
函数 来 操作 它们 。 因 为 我 们 之 前 建 好 的 表 已 定义 了 上 述 数据 类 型 ， 所 以 就 直接 拿 它 们 来 
用 吧 。 


11.2 ”当前 日 期 和 时 间 


最 基本 的 日 期 和 时 间 函 数 ， 就 是 那些 与 当前 日 期 和 时 间 相 关 的 函数 。 你 可 以 用 它们 来 保存 
当前 日 期 和 时 间 ， 或 修改 基于 当前 日 期 和 时 间 的 结果 ， 或 在 结果 集中 显示 日 期 和 时 间 。 现 
在 先 试 试 最 简单 的 一 个 函数 ，NOW()。 你 在 哪个 时 间 点 执行 它 ， 它 就 返回 哪个 时 间 点 。 输 入 
下 例 的 第 一 行 (后面 的 是 结果 ) : 


SELECT NOW( ); 


























4- + 
| NON( ) | 
4- + 
| 2014-02-08 09:43:09 | 
4- + 


如 你 所 见 ， 它 返回 了 服务 器 上 的 日 期 和 时 间 ， 格 式 和 DATETIME 的 格式 一 致 。 所 以 ， 如 果 某 
个 表 中 有 DATETIME 列 ， 那 么 就 可 以 很 方便 地 用 NOW() 给 该 列 录 入 当前 日 期 和 时 间 。 例 如 ， 
bird_sightings 表 的 time_seen 列 就 是 这 样 。 以 下 是 给 该 表 插 入 一 行 数据 时 ， 使 用 NOW() 
的 例子 : 

INSERT INTO bird_sightings 

(bird id，human_id，time_seen，Location_gps) 

VALUES (104, 34, NOW( ), '47.318875; 8.580119 ' ) ; 
你 也 可 以 在 应 用 程序 或 服务 器 脚本 中 使 用 该 函数 ， 这 样 用 户 在 记录 发 现 鸟 的 情况 时 ， 就 可 
以 不 需要 自己 录入 时 间 信 息 了 。 


NOW() 有 几 个 同义词 : CURRENT_TIMESTAMP()、LOCALTIME() 和 LOCALTIMESTAMP( ) 。 
它们 返回 的 结果 都 是 一 样 的 。MySQL 和 MariaDB 提供 这 些 同义词 ， 是 为 了 兼 
容 运 行 于 其 他 SQL 数据 库 的 函数 。 如 果 你 原本 用 的 是 PostgreSQL、Sybase 或 
Oracle， 都 可 以 很 轻松 地 将 它 替换 成 MySQL， 而 无 需 修改 SQL 语句 。 














NoW() 所 返回 的 日 期 和 时 间 是 它 所 在 的 SQL 语句 开始 执行 时 的 日 期 和 时 间 。 大 多 数 情况 用 
它 都 设 问 题 : 如 果 SQL 语句 开始 和 结束 的 时 间 点 极其 相近 ， 又 或 者 你 并 不 介意 取 开 始 时 间 
或 结束 时 间 。 但 如 果 该 SQL 语句 运行 时 间 特 别 长 ， 而 你 想 记录 这 个 过 程 中 的 某 个 时 间 点 ， 
可 使 用 SYSDATE()， 它 返回 的 是 自身 被 执行 时 的 那个 时 间 点 (不 是 整 条 语句 的 结束 时 间 )。 
想 看 看 它 的 特别 之 处 ， 可 引入 SLEEP()， 让 MySQL 在 SQL 语句 的 执行 过 程 中 暂停 指定 的 
秒 数 。 下 面 用 一 个 简单 的 例子 来 展示 NOw() 和 SYSDATE() 的 区 别 : 


SELECT NOW(), SLEEP(4) AS 'Zzz', SYSDATE(), SLEEP(2) AS 'Zzz', SYSDATE(); 





























+- -i +----- +---------- +----- +--------- 十 
| NON() | Zzz | SYSDATE() | Zzz | SYSDATE() 
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+-------- +----- +-------- +----- +-------- 十 
| 2014-02-21 05:44:57 | 0 | 2014-02-21 05:45:01 | 0 | 2014-02-21 05:45:03 | 
4- +----- +------- +----- +-------- 十 


1 row in set (6.14 sec) 


注意 ，NOW() 的 结果 和 第 一 个 SYSDATE() 的 结果 相差 4 秒 ， 这 也 是 第 一 个 SLEEP() 所 指定 
的 秒 数 。 而 SLEEP(2) 则 使 两 个 SYSDATE() 的 结果 差 了 2 秒 。 另 外 ， 我 们 也 留意 到 ， 结 果 
集 之 后 的 提示 信息 表示 ， 执 行 整 条 SQL 语句 所 花 的 时 间 多 于 6 秒 。 你 应 该 很 少 会 用 到 
SYSDATE() 一 一 甚至 完全 不 用 。 它 主要 用 在 一 些 非常 复杂 的 SQL 语句 中 ， 或 者 是 存储 过 程 
和 触发 器 之 中 。 下 面 ， 我 们 还 是 回 到 一 般 的 用 途上 。 

即使 列 不 是 DATETIME 类 型 ， 也 并 不 妨碍 我 们 将 NOW() 的 返回 值 保 存 到 列 中 。 比 如 说 ， 如 果 
time_seen 是 DATE 类 型 ， 那 么 ， 若 再 执行 之 前 那 条 INSERT 语句 ， 它 就 会 报告 说 数据 被 截 
断 。 不 过 ， 日 期 部 分 还 是 能 正确 地 保存 进去 。 同 理 ， 如 果 列 是 TIME 类 型 ， 那 么 也 会 出 现 数 
据 被 截断 的 警告 ,但 时 间 部 分 还 是 正确 地 保存 下 来 。 尽 管 如 此 ， 我 们 最 好 还 是 使 用 匹配 的 
函数 : 用 CURDATE() 的 值 填充 DATE 列 ， 而 用 CURTIME() 的 值 填充 TIME 列 。 以 下 例子 对 比 三 
个 函数 的 差异 : 


SELECT NOW( ), CURDATE( ), CURTIME( ); 


















































+-- +----- +------ + 
| NON( ) | CURDATE( ) | CURTIME( ) | 
+- -i +----- +------- + 
| 2014-02-08 10:23:32 | 2014-02-08 | 10:23:32 | 
+--------- +------------ +-------------- 十 


这 三 个 函数 以 及 它们 的 同义词 所 返回 的 格式 都 很 明了 。 不 过 ， 也 有 内 置 函数 返回 的 是 Unix 
时 间 ， 这 种 格式 显示 的 是 从 Unix 时 间 蕉 (前 面 说 过 ) 至 今 的 秒 数 。 当 需要 比较 两 个 时 间 
型 时 ， 这 种 格式 很 有 用 。 以 下 是 NOW() 的 TIMESTAMP 形式 : 


SELECT UNIX_TIMESTAMP( )，NON(C ); 

















+------------------ +----------- 十 
| UNIX_TIMESTAMP( ) | NOW( ) 

+------------- +---------- 十 
| 1391874612 | 2014-02-08 10:50:12 | 
+---- 4- + 


这 里 的 秒 数 从 1970 年 1 月 1 日 起 计 。 现 在 来 测试 一 下 ， 看 它 到 底 对 不 对 。 我 们 先 用 一 种 
简单 的 计算 方法 ， 得 出 1970 年 至 今 过 了 多 少年 ， 再 用 比较 复杂 的 UNIX_TIMESTAMP() 来 算 : 
SELECT (2014 - 1970) AS 'Simple', 


UNIX_TIMESTAMP( ) AS 'Seconds since Epoch ' ， 
ROUND(CUNIX_TIMESTAMP( ) / 60 / 60 / 24 / 365.25) AS 'CompLicated '; 





+-------- +--------------------- +------------- 十 
| Simple | Seconds since Epoch | Complicated | 
+-------- +--------------------- +------------- 十 
| 44 | 1391875289 | 44 | 
+-------- +--------------------- +------------- 十 
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因为 这 是 在 2014 年 初 执行 的 ， 所 以 我 们 用 了 ROUND() 来 舍 去 多 出 的 几 个 月 所 产生 的 小 数 
部 分 。 这 样 做 测试 是 有 意义 的 ， 你 应 该 能 够 更 加 明白 这 些 函 数 的 用 途 ， 也 更 相信 它们 的 准 
确 性 。 


我 们 再 看 一 个 可 能 需要 用 到 Unix 时 间 的 场景 。 假 设 你 想 知道 观 乌 者 在 多 少 天 之 前 发 现 了 
Black Guineafowl (bird_id 为 309)， 可 以 通过 连接 bird_sightings 和 humans 这 两 个 表 来 
得 到 答案 : 
SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
ROUND( (UNIX_TIMESTAMP( ) - UNIX_TIMESTAMP(time_seen)) / 60 / 60 / 24) 
AS 'Days Since Spotted ' 


FROM bird_sightings JOIN humans USING(human_id) 
WHERE bird_id = 309; 























+------------- +-------------------- 十 
| Birdwatcher | Days Since Spotted | 
+---- +-------------------- 十 
| Marie Dyer | 129 | 
+---- +-------------------- 十 





此 例 先 用 CONCAT() 拼接 出 了 观 鸟 者 的 姓名 ， 然 后 用 第 一 个 不 带 参数 的 UNIX_TIMESTAMP() 获 
取 当 前 日 期 和 时 间 ， 接 着 再 用 一 个 UNIX_TIMESTAMP() 来 指定 time_seen 列 (这 列 包含 观 鸟 
者 发 现 每 种 岛 的 日 期 )。 这 个 函数 将 值 改 成 了 Unix 时 间 格 式 ， 方便 我 们 进行 相 减 。 


比较 日 期 和 时 间 的 方法 和 函数 还 有 很 多 。 我 们 会 在 本 章 后 面 看 到 。 接 下 来 我 们 先 看 看 如 何 
抽取 日 期 和 时 间 中 的 某 部 分 。 


11.3 抽取 日 期 和 时 间 中 的 某 部 分 


有 时 候 ， 时 间 型 数据 所 保存 的 信息 可 能 多 于 你 想 要 的 。 例 如 ， 你 不 想 要 完整 的 日 期 或 时 
间 。 为 应 付 这 种 情况 ，MySQL 提供 了 一 些 用 于 抽取 日 期 和 时 间 中 某 部 分 的 国 数 ， 以 及 一 
些 用 于 指定 抽取 哪 部 分 、 按 什么 格式 返回 的 代码 。 现 在 先 看 一 些 仅 抽取 日 期 或 仅 抽 取 时 间 
的 基本 函数 ， 之 后 再 看 抽取 得 更 细 的 那些 。 


DATETIME 类 型 的 列 ， 顾 名 思 义 ， 同 时 包含 了 日 期 和 时 间 。 如 果 只 想 从 中 抽取 日 期 ， 可 以 用 
DATE() 函数 。 如 果 只 想 抽 取 时 间 ， 则 可 以 用 TIME()。 下 面 看 看 它们 的 用 法 。 我 们 还 是 以 
Black Guineafowl 的 发 现时 间 来 举例 : 


SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
time_seen, DATE(time_seen), TIME(time_seen) 

FROM bird_sightings 

JOIN humans USING(human_id) 

WHERE bird_id = 309; 












































+---- +--------------------- +----------------- +----------------- 十 
| Birdwatcher | time_seen | DATE(time seen) | TIME(time seen) | 
+---- +--------------------- +----------------- +----------------- + 
| Marie Dyer | 2013-10-02 07:39:44 | 2013-10-02 | 07:39:44 | 
+---- +--------------------- +----------------- +----------------- 十 





日 期 和 时 间 函 数 | 157 


很 简 
抽取 





单 ，DATE() 只 返回 了 time_seen 的 日 期 部 分 ， 而 TIME() 则 只 返回 了 时 间 部 分 。 如 果 想 




















日 期 或 时 间 中 的 某 一 元 素 ， 那 也 没 问 题 ， 只 要 它 真 的 含有 该 元 素 一 一 你 总 不 能 从 YEAR 


中 抽取 小 时 吧 。 


想 抽取 小 时 ， 可 以 用 HouUR()。 而 对 于 分 和 秒 ， 则 有 MINUTE() 和 SECOND()。 它 们 都 接受 
DATETIME、TIME 和 TIMESTAMP 作为 参数 。 来 看 看 它们 返回 的 结果 会 是 怎样 。 在 mysql 中 输 
入 以 下 命令 : 





SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
time_seen, HOUR(time_seen), MINUTE(time_seen), SECOND(time_seen) 
FROM bird_sightings JOIN humans USING(human_id) 

WHERE bird_id = 309 \G 


类 淡淡 淡 火 火炎 火炎 类 火炎 淡淡 火 类 淡 火 炎炎 火炎 火 火 类 类 类 十。 row 类 淡淡 火炎 淡 火 炎炎 火炎 类 火 火炎 火炎 火炎 火炎 火炎 火炎 火炎 
Birdwatcher: Marie Dyer 
time_seen: 2013-10-02 07:39:44 
HOUR(time_seen): 7 
MINUTE(time_seen): 39 
SECOND(time_seen): 44 





有 了 这 些 国 数 ， 你 就 可 以 使 用 、 佑 算 和 比较 时 间 中 的 各 个 元 素 。 同 理 ， 日 期 也 是 可 以 拆 
分 的 。 
想 从 日 期 中 抽出 年 月 日 ， 可 以 分 别 使 用 YEAR()、MONTH() 和 DAY()。 它 们 接受 日 期 值 或 含 日 











期 的 字符 串 值 (例如 '2014-02-14'， 注 意 带 有 引号 ) 作为 参数 。 而 数字 的 情况 则 有 固定 的 格 
式 要 求 。 例 如 20140214 是 可 以 的 ， 而 2014-02-14 (没有 引号 ) 就 不 可 以 ，2014 02 14 (有 


























空格 ) 也 不 可 以 。 下 面 把 刚才 的 SQL 语句 改 改 ， 换 上 这 些 函 数 : 





SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
time_seen, YEAR(time_seen), MONTH(time_seen), DAY(time_seen), 
MONTHNAME (time_seen), DAYNAME(time_seen) 

FROM bird_sightings JOIN humans USING(human_id) 

WHERE bird_id = 309 \G 


类 淡淡 淡 火 火炎 火炎 类 火炎 类 火 火 尖 类 火炎 淡 火 大火 火炎 类 类 于 row 类 淡淡 火炎 淡 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 火炎 类 类 
Birdwatcher: Marie Dyer 
time_seen: 2013-10-02 07:39:44 
YEAR(time_seen): 2013 
MONTH(time_seen): 10 
DAY(time_seen): 2 
MONTHNAME( time_seen): October 
DAYNAME( time_seen): Wednesday 


这 里 还 用 到 了 MONTHNAME() 和 DAYNAME() ， 它 们 能 分 别 告诉 你 指定 日 期 是 一 年 中 的 哪个 月 和 


一 周 




















中 的 哪 一 天 。 使 用 这 些 函 数 ， 你 就 能 将 结果 集 整 理 得 更 美观 ， 让 人 看 得 更 方便 。 下 面 














就 试 试用 它们 来 重新 组 织 日 期 信息 。 以 下 例子 将 查 出 会 员 发 现 的 濒危 鸟 种 : 








SELECT common_name AS 'Endangered Bird', 

CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 

CONCAT(DAYNAME(time_seen), ', ', MONTHNAME(time_seen), SPACE(1), 
DAY(time_seen), ', ', YEAR(time_seen)) AS 'Date Spotted', 

CONCAT(HOUR(time_seen), ':', MINUTE(time_seen), 





IF(HOUR(time_seen) < 12，' a.m.', ' p.m.')) AS 'Time Spotted' 
FROM bird_sightings 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
JOIN rookery.conservation_status USING(conservation_status_id) 
WHERE conservation_category = 'Threatened' LIMIT 3; 


+--------------------- +-------------- +---------------------------- +----------- 十 
| Endangered Bird | Birdwatcher | Date Spotted | Time | 
+--------------------- +-------------- +-------------------------- +----------- + 
| Eskimo Curlew | Elena Bokova | Tuesday, October 1, 2013 | 5:9 a.m. 

| Red-billed Curassow | Marie Dyer | Wednesday, October 2, 2013 | 7:39 a.m. | 
| Red-billed Curassow | ELena Bokova | Wednesday, October 2, 2013 | 8:41 a.m. | 
+--------------------- +-------------- +--------------------------- +----------- + 





这 条 SQL 语句 比较 复杂 。 不 过 因为 用 了 好 几 次 JOIN， 所 以 确实 需要 这 么 长 (但 看 着 那 一 
你 可 能 会 想 ， 应 该 有 更 简单 的 做 法 吧 )。 注 意 ， 其 
中 时 和 分 的 结果 是 5:9， 而 不 是 5:09， oR i A 你 当然 可 以 
用 LPAD() 来 修改 ， 但 这 会 搞 得 更 复杂 。 而 IF() 则 用 来 标记 时 间 是 上 午 或 下 午 ( 即 am. 或 
p.m.)。 


我 们 有 更 简洁 的 方法 来 格式 化 日 斯 和 时 间 ， 那 就 是 使 用 格式 化 函数 。 下 一 节 会 介绍 它们 。 
现在 ， 你 可 以 用 EXTRACT() 来 株 代 上 述 抽取 函数 。 


EXTRACT() 可 用 于 抽取 日 期 或 时 间 中 的 任何 部 分 。 它 的 语法 很 简单 ， 但 有 点 见长 : 
EXTRACT(interval FROM date_time)。 其 中 ，interval 与 我 们 之 前 看 过 的 那些 日 期 和 时 间 抽 
取 函 数 的 名 字 相 似 : MONTH 是 月 份 ，HOUR 是 小 时 ， 以 此 类 推 。 此 外 ， 还 有 一 些 组 合 起 来 的 
国 数 ， 比 如 YEAR_MONTH 和 HOUR_MINUTE。 想 知道 EXTRACT() 的 各 种 interval 以 及 类 似 的 函 
数 ， 见 表 11-1。 


表 11-1: Interval 及 返回 格式 


























Interval 返回 格式 Interval 返回 格式 
DAY dd MINUTE mm 
DAY_HOUR "dd hh' MINUTE_MICROSECOND "mm.nn' 
DAY_MICROSECOND "dd.nn' MINUTE_SECOND "mm:Sss' 
DAY_MINUTE "dd hh:mm' MONTH mm 
DAY_SECOND "dd hh:mm:ss' QUARTER qq 

HOUR hh SECOND SS 
HOUR_MICROSECOND "hh.nn' SECOND_MICROSECOND "ss.nn' 
HOUR_MINUTE "hh :mm WEEK WW 
HOUR_SECOND "hh:mm:ss' YEAR yy 
MICROSECOND nn YEAR_MONTH "yy-mm 








现在 试 着 用 EXTRACT() 来 改写 “ 谁 在 什么 时 候 发 现 了 Black Guineafowl” 这 个 例子 : 


SELECT time_seen, 
EXTRACT(YEAR_MONTH FROM time_seen) AS 'Year & Month ' ， 
EXTRACT(MONTH FROM time_seen) AS 'Month OnLy ' ， 
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EXTRACT(HOUR_MINUTE FROM time_seen) AS 'Hour & Minute ' ， 
EXTRACT(HOUR FROM time_seen) AS 'Hour Only' 
FROM bird_sightings JOIN humans USING(human_id) 


LIMIT 3; 
+--------------------- +-------------- +------------ +--------------- +----------- 十 
| time_seen | Year & Month | Month Only | Hour & Minute | Hour Only | 
+--------------------- +-------------- +------------ +--------------- +----------- 十 
| 2013-10-01 04:57:12 | 201310 | 10 | 457 | 4 | 
| 2013-10-01 05:09:27 | 201310 | 10 | 509 | 5 | 
| 2013-10-01 05:13:25 | 201310 | 10 | 513 | 5 | 
+--------------------- +-------------- +------------ +--------------- +----------- 十 





如 你 所 见 ， 用 EXTRACT() 单独 显示 某 个 部 分 的 话 ， 看 起 来 与 之 前 那些 日 期 和 时 间 抽 取 函 数 
一 样 ， 没 什么 问题 。 但 HOUR_MINUTE 却 没 有 在 时 和 分 之 间 加 上 冒号 (4:57 变 成 了 457)， 这 
就 不 太 符 合 人 们 的 阅读 习惯 了 。 用 EXTRACT() 输出 元 素 组 合 时 ， 它 会 直接 将 两 个 元 素 拼 在 
一 起 ， 不 会 进行 格式 化 。 可 能 有 时 你 就 想 要 这 种 效果 ,但 更 多 时 候 这 是 非 主流 的 。 所 以 ， 
你 还 需要 学 习 下 一 节 的 日 期 和 时 间 格 式 化 函数 。 


11.4 格式 化 日 期 和 时 间 


在 11.1 节 中 ， 我 简要 介绍 过 MySQL 和 MariaDB 中 的 日 期 和 时 间 数 据 类 型 ， 以 及 它们 的 保 
存 格式 。 我 也 说 过 ， 如 果 你 不 喜欢 这 些 格式 ， 可 以 用 一 些 内 置 函 数 来 将 时 间 数 据 转 换 成 其 
他 显示 格式 。 其 中 ， 最 好 用 的 函数 就 是 DATE_FORMAT() 和 TIME_FORMAT()。 它 们 可 以 处 理 来 
自 列 、 字 符 串 或 其 他 函数 的 日 斯 和 时 间 值 ， 你 只 需 指 定 自己 想 要 的 格式 的 代码 即 可 。 现 在 
试 试用 这 两 个 函数 改写 上 一 市 最 后 的 那个 例子 : 


SELECT common_name AS "Endangered Bird', 

CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
DATE_FORMAT(time_seen, '%W, %M %e, %Y') AS 'Date Spotted', 
TIME_FORMAT(time_seen, '%l:%i %p') AS 'Time Spotted ' 

FROM bird_sightings 

JOIN humans USING(human_id) 

JOIN rookery.birds USING(bird_id) 

JOIN rookery.conservation_status USING(conservation_status_id) 
WHERE conservation_category = 'Threatened' LIMIT 3; 









































+--------------------- +-------------- +- +----- + 
| Endangered Bird | Birdwatcher | Date Spotted | Time | 
+--------------------- +-------------- +---------------------------- +----------- 十 
| Eskimo Curlew | Elena Bokova | Tuesday, October 1, 2013 | 5:09 AM 

| Red-billed Curassow | Marie Dyer | Wednesday, October 2, 2013 | 7:39 AM | 
| Red-billed Curassow | Elena Bokova | Wednesday, October 2, 2013 | 8:41 AM | 
+--------------------- +-------------- +- +----- + 


整 条 SQL 语句 依然 很 元 长 ， 但 日 期 和 时 间 格式 化 的 相关 代码 看 起 来 清晰 了 。 在 DATE_ 
FORMAT() 和 TIME_FORMAT() 中 ， 第 一 个 参数 是 待 格式 化 的 列 ， 第 二 个 参数 是 格式 代码 。 顺 
便 说 一 下 ，DATE_FORMAT() 可 以 返回 时 间 ， 所 以 其 实 没 必要 使 用 TIME_FORMAT()。 是 否 使 用 ， 
取决 于 编码 风格 。 





之 前 的 写法 所 日 





4 现 的 问题 〈 例 如 分 钟 没有 补 0， 时 和 分 没有 用 


冒 





号 隔 开 ， 以 及 需要 用 IF() 


判断 上 下 午 )， 在 这 里 都 消失 了 。 用 格式 化 代码 "六 :类 %p' 即 可 达到 我 们 想 要 的 效果 。 如 
果 还 想 显示 秒 ， 那 么 可 以 直接 用 '%r' 来 替代 那 三 个 代码 。 表 11-2 展示 了 各 种 格式 代码 及 






















































































相应 的 返回 值 。 

表 11-2: 日 期 和 时 间 格 式 代码 

代 码 描 述 

%a 简写 的 周 几 

%b 简写 的 月 份 名 字 

%c 月 份 (数字 形式 ) 

%d 一 个 月 中 的 哪 一 天 (数字 形式 ) 

%D 一 个 月 中 的 哪 一 天 ( 带 有 英文 后 级 ) 

%e 一 个 月 中 的 哪 一 天 (数字 形式 ) 

%f 毫秒 (数字 形式 ) 

%h 小 时 

%H 小 时 

和 分 钟 (数字 形式 ) 

%I 小 时 

%j 一 年 中 的 哪 一 天 

%k 小 时 

%1 小 时 

%m 月 份 (数字 形式 ) 

%M 月 份 名 字 

%p AM 或 PM 

%r 时 间 ，12 小 时 制 

%s 秒 

%S 秒 

%T 时 间 ，24 小 时 制 

%u 一 年 中 的 第 几 周 〈 以 周一 为 一 周 的 第 一 天 ) 

%U 一 年 中 的 第 几 周 〈 以 周 日 为 一 周 的 第 一 天 ) 

%v 一 年 中 的 第 几 周 〈 以 周一 为 一 周 的 第 一 天 ， 与 %x 一 起 使 用 ) 

%V 一 年 中 的 第 几 周 〈 以 周 日 为 一 周 的 第 一 天 ， 与 %X 一 起 使 用 ) 

和 w 一 周 中 的 哪 一 天 

和 周 几 

%x 某 一 周 所 属 的 年 份 ( 以 周一 为 一 周 的 第 一 天 ， 四 位 数字 形式 ， 与 
%v 一 起 使 用 ) 

%X 某 一 周 所 属 的 年 份 〈 以 周 日 为 一 周 的 第 一 天 ， 四 位 数字 形式 ， 与 
%V 一 起 使 用 ) 

%y 年 份 〈 两 位 数字 形式 ) 

%Y 年 份 ( 四 位 数字 形式 ) 

%% 字面 的 % 




















结 果 
(Sun...Sat) 
(Jan...Dec) 

(1...12) 

(00...31) 

(1st, 2nd, 3rd...) 
(0...31) 
(000000...999999) 
(01...12) 

(00...23) 

(00...59) 

(01...12) 
(001...366) 

(0...23) 

(1...12) 

(01...12) 
(January...December) 
AM or PM 
(hh:mm:ss [AP]MD) 
(00...59) 

(00...59) 
(hh:mm:ss) 

(0...52) 

(0...52) 

(1...53) 

(1...53) 
(0=Sunday...6=Saturday) 
(Sunday...Saturday) 


(yyyy) 
(yyyy) 
(yy) 


(yyyy) 
‘op 
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世界 各 地 都 有 自己 喜好 的 日 斯 和 时 间 的 格式 标准 。 下 一 市 就 来 研究 这 个 问题 ， 并 看 看 如 何 
调整 时 区 。 


11.5 调整 格式 标准 和 时 区 


日 期 和 时 间 的 格式 有 几 种 标准 。 例 如 一 年 中 的 最 后 一 日 ， 可 以 写成 12-31-2014 或 31-12- 
2014。 要 用 哪 种 格式 ， 一 般 取 决 于 你 所 在 的 地 区 ， 或 你 的 老板 和 客户 的 喜好 ， 或 一 些 其 他 
因素 。 想 查 出 一 个 特定 标准 的 日 期 格式 ， 可 以 用 GET_FORMAT(): 


SELECT GET_FORMAT(DATE, 'USA'); 




















4- + 
| GET_FORMAT(DATE, 'USA') | 
+- -7 + 
| %m.%d .%Y | 
+--------------- 十 





顾名思义 ，GET_FORMAT() 可 以 返回 某 一 地 区 的 时 间 格 式 ， 该 格式 能 直接 用 于 DATE_ 
FORMAT()， 使 时 间 值 格式 化 。 可 能 你 会 觉得 奇怪 ， 美 国 竟然 用 句点 而 不 是 用 横 杠 来 分 隔年 
月 日 。GET_FORMAT() 的 用 法 是 : 在 第 一 个 参数 填写 你 想 要 日 期 还 是 时 间 ， 或 者 两 个 都 要 
(DATE、TIME 或 DATETIME) ， 然 后 在 第 二 个 参数 填写 日 期 或 时 间 标准 的 名 称 ， 可 选 值 如 下 : 

。 EUR 代表 欧洲 

。 INTERNAL 代表 没有 标点 符号 的 时 间 格 式 

。 IS0 代表 ISO 9075 标准 

。 JIS 代表 日 本 工业 标准 

。 USA 代表 美国 


MySQL 默认 使 用 IS0 (yyyy-mm-dd hh:mm:ss) 来 显示 日 期 和 时 间 。 
用 GET_FORMAT() 试 试 以 下 这 个 简单 的 例子 : 


SELECT GET_FORMAT(DATE, 'USA'), GET_FORMAT(TIME, 'USA'); 




















+- -7 +- + 
| GET_FORMAT(DATE, 'USA') | GET_FORMAT(TIME, 'USA') | 
4- 4+- + 
| %m.%d .%Y | %h:%i:%s %p | 
+- -7 4- + 


试 试用 GET_FORMAT() 来 返回 各 种 标准 代码 ， 以 便 熟悉 不 同 的 显示 格式 一 一 当然 ， 也 可 以 
查阅 文档 (http://dev.mysql.com/doc/reftman/5.6/en/date-and-time-functions.html#function_get- 
format)。 试 完 以 后 , 运行 下 面 这 条 SQL 语句 ,看 看 该 函数 如 何 与 DATE_FORMAT() 结合 使 用 : 


SELECT DATE_FORMAT(CURDATE(), GET_FORMAT(DATE, 'EUR')) 
AS 'Date in Europe', 

DATE_FORMAT(CURDATE(), GET_FORMAT(DATE, 'USA' )) 
AS 'Date in U.S.', 

REPLACE(DATE_FORMAT(CURDATE(), GET_FORMAT(DATE,'USA')), '.', '-') 
AS 'Another Date in U.S.'; 
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+---------------- +-------------- +---------------------- 十 
| Date in Europe | Date in U.S. | Another Date ;in U.S. | 
+---------------- +-------------- +---------------------- 十 
| 18.02.2014 | 92.18.2014 | 02-18-2014 | 
+--- +---- +---------------------- 十 


因为 我 并 不 认同 美国 用 句点 来 分 隔年 月 日 ， 所 以 ， 我 在 最 后 那个 域 用 了 REPLACE()， 将 名 
点 替换 成 横 枉 。GET_FORMAT() 其 实 并 不 常用 ， 但 不 妨 稍 作 了 解 。 比 较 常 用 且 与 之 类 似 的 一 
个 国 数 是 CONVERT_TZ() 。 
CONVERT_TZ() 可 以 进行 时 区 转换 。 不 过 ， 在 转换 之 前 ， 我 们 还 是 先 用 以 下 语句 查 查 服务 器 
当前 使 用 的 是 哪个 时 区 : 


SHOW VARIABLES LIKE "time_zone ' ; 



































+--------------- +-------- + 
| Variable name | Value | 
+--- +-------- 十 
| time_zone | SYSTEM | 
+--- +-------- 十 

















这 个 结果 的 意思 是 ， 我 们 使 用 的 是 文件 系统 的 时 间 ， 而 这 个 时 间 一 般 按 服务 器 所 处 的 位 置 
来 定 。 假 设 我 们 的 观 鸟 网 站 使 用 的 服务 器 位 于 美国 马萨诸塞 州 的 波士顿 ， 使 用 的 是 美国 东 
部 时 间 。 然 后 ， 有 个 意大利 罗马 的 用 户 在 早上 (欧洲 中 部 时 间 ) 录入 了 一 条 鸟 种 发 现 信 
息 ， 但 我 们 不 希望 它 记 录 波 士 顿 的 时 间 ， 而 记录 原 时 区 的 时 间 。 否 则 ， 美 国人 会 以 为 意 大 
利 人 总 是 在 晚上 去 观 鸟 ,或 者 总 是 在 日 间 发 现 猎头 辜 之 类 的 夜行 动物 。 于 是 ， 我 们 需要 用 
CONVERT_TZ() 来 调整 一 下 时 间 。 


CONVERT_TZ() 接受 三 个 参数 : 日 期 和 时 间 ， 来 自 哪 个 时 区 ， 想 转换 成 哪个 时 区 。 下 面 是 一 
个 例子 : 


SELECT common_name AS 'Bird', 

CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher ' ， 

DATE_FORMAT(time_seen, '%r') AS "System Time Spotted ' ， 

DATE_FORMAT(CONVERT_TZ(time_seen, 'US/Eastern', 'Europe/Rome'), '%r') 
AS 'Birder Time Spotted ' 

FROM bird_sightings 

JOIN humans USING(human_id) 

JOIN rookery.birds USING(bird_id) 

JOIN rookery.conservation_status USING(conservation_status_id) LIMIT 3; 





























+--- +------------------ +------------------- +--------------------- + 
| Bird | Birdwatcher |System Time Spotted| Birder Time Spotted | 
+---------------- +------------------ +------------------- +--------------------- 十 
| Whimbrel | Richard Stringer | 04:57:12 AM | 10:57:12 AM | 
| Eskimo Curlew | Elena Bokova | 05:09:27 AM | 11:09:27 AM | 
| Marbled Godwit | Rusty Osborne | 05:13:25 AM | 11:13:25 AM | 
+--- +------------------ +------------------- +--------------------- + 


注意 ， 此 结果 集中 ， 我 们 转换 出 了 一 个 比 系统 时 区 快 六 个 小 时 的 时 区 。 那 是 因为 我 们 假设 
所 有 人 都 在 罗马 所 在 的 时 区 。 其 实 我 们 可 以 给 humans 表 加 一 列 ， 用 于 填写 用 户 所 在 时 区 ， 
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或 让 他 们 自 定 义 。 至 于 如 何 猜 测 时 区 ， 可 以 在 用 户 注册 时 ， 让 他 们 的 浏览 器 告知 我 们 其 所 
在 位 置 ， 又 或 者 用 其 他 更 聪明 的 方法 。 同 时 ， 我 们 也 允许 用 户 在 发 现 猜测 出 错时 ， 重 新 选 
择 时 区 。 不 过 ， 无 论 你 怎样 确定 和 保存 时 区 ， 都 要 修改 上 面 那 条 SQL 语句 ， 把 时 间 改 成 
CONVERT_TZ() 转换 的 那个 值 。 


注意 ，CONVERT_TZ() 所 接受 的 时 区 代码 不 一 定 是 三 位 的 〈 如 CET 代表 欧洲 中 部 时 间 )。 具 
体 可 选 什么 时 区 ， 都 已 设置 在 MySQL 中 (CET 也 是 这 样 被 设置 进去 的 )。 如 果 你 运行 上 
看 那 条 SQL 语句 ， 却 看 见 CONVERT_TZ() 返回 了 NULL， 那 可 能 是 因为 该 时 区 信息 疫 加 载 
好 。 如 果 是 Unix 之 类 的 系统 ， 在 安装 MySQL 和 MariaDB 时 ， 你 会 在 /usr/share/zoneinfo 
目录 中 找到 时 区 文件 。 列 出 该 目录 的 文件 ， 就 会 看 到 CONVERT_TZ() 所 使 用 的 时 区 代码 。 例 
如 ， 其 中 的 US 目录 就 有 一 个 叫 Eastern 的 文件 。 因 此 ， 可 以 使 用 US/Eastern 这 个 时 区 。 若 
想 安装 时 区 文件 ， 可 以 使 用 以 下 命令 (文件 路 径 请 按 实际 填写 ) : 


mysql_tzinfo to_sql /usr/share/zoneinfo | mysql -p -UuU root mysql 


如 果 你 用 的 是 Windows， 可 以 到 Oracle 的 网 站 下 载 时 区 表 (http://dev.mysql.com/ 
downloads/timezones.html) 。 该 网 页 上 会 有 一 些 安 装 指南 教 你 怎样 安装 。 装 完 之 后 ， 再 运行 
一 次 上 面 那 条 SQL 语句 ， 确 保安 装 正确 。 


你 也 可 以 把 时 区 设置 改 得 与 服务 器 所 在 的 时 区 不 同 。 不 需要 移动 服务 器 或 调整 文件 系统 的 
时 钟 ， 就 可 以 修改 服务 器 的 时 区 。 我 们 可 以 给 它 设置 一 个 更 加 全 球 化 的 时 区 ， 比 如 格林 威 
治标 准时 间 (GMT 或 UTC)。 因 为 观 鸟 研究 这 门 学 问 可 追溯 到 英国 (这 得 归功 于 像 约 营 
夫 . 班 克 斯 和 查尔斯 . 达尔 文 这 样 的 植物 学 家 )， 所 以 ， 我 们 就 选用 GMT 吧 。 可 以 用 SET 
语句 来 设置 时 区 : 


SET GLOBAL time zone = 'GMT'; 


如 果 只 想 在 本 次 会 话 应 用 该 时 区 设置 ， 那 就 去 掉 GLOBAL 选项 。 如 果 不 想 服 务 器 重启 后 设置 
都 被 重 置 ， 最 好 将 它 写 在 服务 器 的 配置 文件 中 ( 即 my.cnf 或 my.ini)。 具 体 的 做 法 是 把 下 
面 这 行 代码 写 进 [mysqld] 那 一 部 分 : 

defauLt-time-zone='GMT' 


如 果 不 用 SET 而 用 这 种 方法 ， 就 需要 重启 服务 器 才能 使 它 被 读 取 生 效 。 重 启 之 后 ， 再 运行 
一 次 SHOW VARIABLES， 看 看 结果 如 何 。 

修改 服务 器 时 区 设置 ， 或 者 用 CONVERT_TZ() 将 显示 的 时 间 调 成 用 户 的 时 区 ， 都 能 使 用 户 产 
生 归 属 感 。 没 有 这 些 ， 用 户 可 能 会 觉得 自己 被 排斥 。 所 以 ， 为 了 使 自己 的 网 站 和 服务 更 加 
国际 化 ， 还 得 好 好 学 习 CONVERT_TZ() 才 行 。 


11.6 日 期 和 时 间 的 加 减 


MySQL 和 MariaDB 都 提供 了 一 些 修改 指定 日 期 和 时 间 的 内 置 函 数 。 你 可 以 使 用 它们 在 茶 
个 日 期 上 进行 加 减 运 算 ， 使 其 变 成 未 来 或 过 去 的 时 间 。 而 实现 这 种 运算 的 最 主要 、 最 常 
用 的 函数 ， 就 是 DATE_ADD() 和 DATE_SUB()。 它 们 的 语法 一 样 : 第 一 个 参数 是 要 修改 的 日 
期 ， 第 二 个 参数 是 时 间 量 。 时 间 量 的 写法 是 : 在 INTERVAL 关键 字 后 接 上 数字 和 单位 (例如 
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INTERVAL 1 DAY) 。 


先 看 一 个 DATE_ADD() 的 例子 。 假 设 我 们 想 把 英国 所 有 用 户 的 过 期 日 延迟 三 个 月 ， 可 以 采用 
如 下 方式 : 

UPDATE humans 

SET membership_expiration = DATE_ADD(membership_expiration, INTERVAL 3 MONTH) 


WHERE country_id = "uk’ 
AND membership_expiration > CURDATE( ); 


此 例 中 ， 我 们 选取 英国 的 未 过 期 用 户 ， 然 后 给 他 们 的 membership_expiration 加 上 3 
个 月 。 注 意 ， 判 断 是 否 已 过 期 是 很 简单 的 运算 ， 只 要 在 whERE 中 用 大 于 号 (>) 来 比 
较 membership_expiration 和 当前 日 期 即 可 。 另 外 ， 请 注意 我 们 是 如 何 将 membership_ 
expiration 修改 成 三 个 月 之 后 的 。 因 为 日 期 和 时 间 函 数 不 会 将 结果 应 用 到 列 中 ， 所 以 需要 
用 其 他 方法 来 修改 保存 好 的 数据 。 想 知道 DATE_ADD() 接受 什么 单位 ， 以 及 一 些 类 似 的 日 期 
和 时 间 函 数 ， 可 参考 表 11-1。 


再 看 看 DATE_SUB()。 假 设 有 个 叫 Melissa Lee 的 会 员 想 将 自己 的 过 期 日 改 成 一 年 之 后 ， 但 却 
错 改 成 了 两 年 之 后 。 那 么 ， 我 们 可 以 通过 以 下 语句 进行 修正 : 
UPDATE humans 


SET membership_expiration = DATE_SUB(membership_expiration, INTERVAL 1 YEAR) 
WHERE CONCAT(name_first, SPACE(1), name_last) = 'Melissa Lee'; 


其 实 ， 我 们 应 该 先 查 出 准确 的 human_id， 然 后 在 WHERE 子 句 中 使 用 它 ， 因 为 叫 Melissa Lee 
的 可 能 不 止 一 个 。 


DATE_ADD() 非常 有 用 ， 所 以 ， 再 多 看 几 个 它 的 用 例 吧 。 首 先 将 上 例 改 成 不 用 DATE_SUB() ， 
而 用 DATE_ADD() : 
UPDATE humans 


SET membership_expiration = DATE_ADD(membership_expiration, INTERVAL -1 YEAR) 
WHERE CONCAT(name_first, SPACE(1), name_last) = 'Melissa Lee'; 


基本 上 没 改 什么 ， 只 是 换 成 了 DATE_ADD()， 并 将 数量 变 成 -1， 以 代表 我 们 想 要 减 去 1 年 ， 
而 非 增 加 1 年 (尽管 函数 名 M 员 DATE_ADD() ) 。 


再 看 一 个 使 用 DATE_ADD() 的 例子 。 假 设 有 个 会 员 在 记录 鸟 种 发 现 信 息 时 ， 不 知 为 何 日 期 和 
时 间 都 错 了 。 她 告知 我 们 ， 在 time_seen 的 记录 中 ， 正 确 的 时 间 应 是 错误 时 间 的 一 天 两 小 
时 之 后 。 于 是 ， 我 们 先 找 出 该 次 发 现 的 sighting_id， 然 后 执行 以 下 SQL 语句 来 更 新 日 期 
和 时 间 : 

UPDATE bird_sightings 


SET time_seen = DATE_ADD(time_ seen, INTERVAL '1 2' DAY_HOUR) 
WHERE sighting_id = 16; 


此 例 中 ， 单 位 是 DAY_HOUR (日 和 小 时 )， 所 以 声明 数量 时 ， 要 按 顺 序 给 出 日 数 和 小 时 数 ， 
并 把 它们 放 在 引号 中 间 。 如 果 你 想 做 的 是 减法 (如 一 天 两 小 时 之 前 )， 可 以 在 引号 中 的 其 
中 一 个 参数 前 加 上 负 号 。 顺 便 说 一 下 ， 在 同一 个 DATE_ADD() 中 ， 不 能 既 做 加 法 又 做 减法 。 
只 能 先 在 一 个 DATE_ADD() 中 进行 一 种 运算 ,然后 把 它 租 进 做 另 一 种 运算 的 DATE_ADD() 中 。 
表 11-1 列 有 各 种 可 用 的 组 合 单位 。 
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当 使 用 DATE_ADD() 之 类 的 函数 来 让 MySQL 计算 新 的 日 期 和 时 间 时 ， 它 会 在 后 台 确 定 新 
结果 。 基 本 上 ， 它 是 先 将 所 有 日 期 和 时 间 转 换 成 秒 ， 然 后 再 进行 加 减 ， 最 后 返回 新 的 日 期 
和 时 间 。 当 你 想 更 精确 地 控制 这 些 运 算 时 ， 有 时 候 会 想 确 定 运算 的 方法 。 这 个 时 候 可 以 用 
TIME_TO_SEC() 和 SEC_TO_TIME() 人 
TIME_TO_SEC() 可 将 时 间 转 换 成 秒 数 ， 这 样 运算 起 来 很 简单 。 如 果 你 传 给 它 一 个 含有 日 期 
和 时 间 的 值 ， 它 也 只 会 取 时 间 部 分 。 下 面 演 示 一 个 例子 ， 看 看 它 返 回 的 结果 如 何 : 

SELECT TIME(NOW()), 


TIME_TO_SEC(NOW()), 
TIME_TO_SEC(NOW()) / 60 /60 AS 'Hours'; 


























+-- 4- +------------ + 
| NOW() | TIME_TO_SEC(NOW()) | Hours | 
+- -i + +------------ + 
| 2014-02-18 03:30:00 | 12600 | 3.50000000 | 
+------------- +------------- +------------ + 


第 一 列 是 当前 的 日 期 和 时 间 。 时 间 部 分 是 3:30 am.。 而 在 第 二 列 ，TIME_T0_SEC() 将 该 时 间 
(一 天 中 的 三 个 半 小 时 ) 转换 成 了 12 600 秒 。 然 后 ， 第 三 列 确认 了 12 600 秒 正 是 3.5 小 时 。 


相反 ， 如 果 已 知 一 件 事 的 持续 秒 数 ， 就 可 以 用 SEC_TO_TIME() 来 计算 出 时 间 。 假 设 你 想 得 知 
两 件 事 之 间 的 间隔 时 间 ， 例 如 ， 我 们 在 网 上 推出 了 一 个 鸟 种 识别 测试 。 在 这 个 测试 中 ， 用 
户 需 要 从 图 中 认 出 一 种 鸟 。 我 们 可 以 用 一 列 记 下 图 片 显 示 的 一 刻 ， 然 后 ， 用 同一 个 表 的 另 
一 列 记录 用 户 输入 正确 答案 的 一 刻 。 这 样 ， 我 们 就 可 以 用 SEC_TO_TIME() 来 计算 出 间隔 时 间 
(以 hh:mm:ss 形式 显示 )。 为 了 演示 这 个 例子 ， 我 们 先 建 一 个 记录 每 个 观 鸟 者 测试 成 绩 的 表 ， 

CREATE TABLE bird_identification_tests 

(test_id INT AUTO_INCREMENT KEY ， 

human_id INT, bird_id INT， 

id_start TIME, 

id_end TIME); 


这 个 表 并 不 复杂 : 我 们 只 想 记 录 会 员 的 human_id， 图 片 中 鸟 种 的 bird_id， 以 及 测试 的 开 
始 时 间 和 结束 时 间 。 我 们 不 关心 日 期 ， 只 关心 会 员 花 了 多 长 时 间 才 识别 出 一 种 鸟 。 现 在 ， 
向 该 表 录 入 数据 ， 因 为 只 想 试 一 下 SEC_T0_TIME()， 所 以 一 行 数据 就 够 了 : 


INSERT INTO bird_identification_tests 
VALUES(NULL, 16, 125, CURTIME(), NULL); 


注意 ， 我 们 暂时 不 录入 id_end， 那 要 等 到 会 员 做 完 测试 时 才 有 数据 。 这 只 是 一 种 模拟 ， 如 
果 是 在 真实 的 应 用 中 ， 我 们 会 用 一 个 脚本 封装 这 个 INSERT， 然 后 在 图 片 展示 时 ， 执 行 该 脚 
本 以 录入 开始 时 间 。 当 用 户 识别 出 乌 种 时 ， 再 执行 另 一 个 包含 UPDATE 的 脚本 ， 以 记录 结束 
时 间 。 现 在 ， 先 继续 模拟 。 执 行 INSERT 之 后 ， 稍 等 片刻 ， 再 执行 以 下 SQL 语句 ， 写 入 id_ 


end 



























































UPDATE bird_ identification_tests 
SET id_end = CURTIME(); 


这 样 ， 表 中 唯一 一 行 的 id_end 就 被 更 新 为 “当前 上 时间” 了 。 现 在 我 们 可 以 在 SELECT 中 运 
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用 SEC_TO_TIME()， 看 看 这 个 函数 是 怎么 回 事 ; 


SELECT CONCAT(name_first, SPACE(1), name_last) 
AS 'Birdwatcher', 

common_name AS "Bird ' ， 

SEC_TO_TIME( TIME_TO_SEC(id_end) - TIME_TO_SEC(id_start) ) 
AS 'Time ELapsed ' 

FROM bird_identification_tests 

JOIN humans USING(human_id) 

JOIN rookery.birds USING(bird_id); 





+---- +------------------ +-------------- 十 
| Birdwatcher | Bird | Time Elapsed | 
+---- +------------------ +-------------- 十 
| Ricky Adams | Crested SheLduck | 00:01:21 | 
+------------- +------------------ +-------------- 十 


不 过 ， 当 id_start 和 id_end 不 在 同一 天 时 ,该 SQL 语句 会 出 现 问 题 。 例 如 ， 在 午夜 前 开 
始 测 试 ， 在 午夜 后 完成 测试 。 这 样 ，id_end 就 会 小 于 id_start， 看 起 来 就 像 是 事件 在 开始 
前 就 结束 了 。 为 了 容纳 这 种 可 能 ， 需 要 构造 一 个 包含 IF() 函数 的 更 复杂 的 SQL 语句 ， 以 
识别 这 种 少 有 的 情况 。 而 对 于 超过 24 小 时 才 完 成 测试 的 情况 ， 则 无 法 识别 ， 你 只 能 用 其 
他 方法 ， 例 如 ， 在 超过 24 小 时 后 ， 断 开会 话 ， 以 防止 记录 这 样 的 时 间 。 若 真 想 记 录 ， 就 
需要 用 DATETIME 类 型 ， 以 及 能 比较 日 期 和 时 间 的 函数 (这 会 在 下 一 节 讲 到 )。 


现在 再 多 看 一 个 日 期 加 减 函数 PERIO0D_ADD()。 它 接受 两 个 参数 ， 第 一 个 是 日 期 ， 第 二 个 是 
想 要 增加 的 月 的 数量 。 也 可 以 用 它 来 减少 日 期 中 的 月 数 ， 只 要 给 第 二 个 参数 传 负 数 即 可 。 


PERIOD_ADD() 在 本 章 中 看 起 来 有 点 奇怪 ， 因 为 它 接受 的 参数 不 是 日 期 类 型 ， 而 是 字符 串 类 
型 ， 同 时 ， 返 回 值 也 是 字符 串 。 这 个 作为 参数 的 字符 串 需 要 含有 一 个 两 位 或 四 位 的 年 份 ， 
以 及 一 个 两 位 的 月 份 〈 例 如 ，2014 年 4 月 可 以 写成 1404 或 201404) 。 现 在 用 birdwatchers 
假设 我 们 想 统计 每 个 会 员 发 现 了 多 少 岛 ， 不 过 ， 限 定时 间 范 围 为 上 一 季度 。 这 看 起 来 好 像 
很 简单 ， 似 乎 只 要 在 SELECT 的 WHERE 中 用 QUARTER() 就 能 做 到 ， 如 下 所 示 : 

SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 

COUNT(time_seen) AS 'Sightings Recorded ' 

FROM bird_sightings 

JOIN humans USING(human_id) 

WHERE QUARTER(time_seen) = (QUARTER(CURDATE()) - 1) 


AND YEAR(time_ seen) = (YEAR(CURDATE( )) - 1) 
GROUP BY human_id LIMIT 5; 















































Empty set (0.14 sec) 





























返回 的 却 是 空 集 。 这 里 有 两 个 问题 。 一 ， 如 果 你 在 第 一 季度 执行 QUARTER(CURDATE()) - 1， 
它 并 不 会 智能 地 返回 4， 只 会 返回 0， 而 QUARTER(time_seen) 只 可 能 在 1 到 4 之 间 ， 所 以 
在 第 一 季度 执行 时 ， 单 赁 这 名 就 会 返回 空 集 ， 二 ， 如 果 你 误 以 为 QUARTER(CURDATE()) - 1 














能 从 第 一 季度 退回 到 第 四 季度 ， 那 么 当然 会 想 让 年 份 也 退回 到 上 一 年 ， 所 以 你 会 写 出 AND 
YEAR(time_seen) = (YEAR(CURDATE( )) - 1)， 但 要 是 你 在 第 二 、 三 、 四 季度 执行 ， 那 就 真 
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的 退 了 一 整 年 ， 这 样 并 不 符合 “限定 时 间 范 围 为 上 一 季度 ”这 一 需求 。 

因此 得 修改 这 条 SQL 语句 。 我 们 需要 多 次 用 到 PERIOD_ADD() 以 及 其 他 之 前 讲 过 的 日 期 时 
间 函 数 。 改 好 的 SQL 语句 如 下 ， 不 管 在 哪个 季度 执行 ， 它 都 能 返回 上 一 季度 每 个 用 户 所 发 
现 的 鸟 种 总 


SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 

COUNT(time_seen) AS 'Sightings Recorded ' 

FROM bird_sightings 

JOIN humans USING(human_id) 

WHERE CONCAT(QUARTER(time_seen), YEAR(time_seen)) = 

CONCAT( 

QUARTER( 
STR_TO_DATE( 
PERIOD_ADD( EXTRACT(YEAR_MONTH FROM CURDATE()), -3), 

'%Y%m' ) )， 




















YEAR( 
STR_TO_DATE( 
PERIOD_ADD( EXTRACT(YEAR_MONTH FROM CURDATE()), -3), 
'%Y%m') ) ) 
GROUP BY human_id LIMIT 5; 


半 
! 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
! 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 


| Birdwatcher Sightings Recorded | 


证 
! 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 


| Richard Stringer 
| Rusty Osborne 

| Elena Bokova 

| Katerina Smirnova 
| Anahit Vanetsyan 


+ 一 一 一 一 一 + 一 ++ 


党 
1 
1 
1 
1 
! 
! 
! 
! 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 





为 了 方便 阅读 ， 我 加 了 不 少 缩 进 。 首 先 ， 使 用 EXTRACT() 从 CURDATE() 抽取 出 年 份 和 月 份 ， 
并 转换 成 PERIOD_ADD() 所 接受 的 格式 (yyyymm) ;然后 用 PERIOD_ADD() 求 得 三 个 月 前 的 月 
份 ， 接着 分 别 用 QUARTER() 和 YEAR() 求 出 其 季度 数 和 所 在 年 份 。 其 间 ， 我 们 还 用 了 STR_ 
TO_DATE() 来 将 PERIOD_ADD() 的 结果 转换 成 日 期 。 


最 后 ， 把 季度 数 和 年 份 拼接 起 来 ， 与 同样 拼接 的 time_seen 的 季度 数 和 年 份 作 比较 。 如 果 
EXTRACT() 有 YEAR_QUARTER 选项 的 话 ， 那 会 简单 得 多 ， 不 用 我 们 自己 计算 两 次 “三 个 月 前 
的 月 份 ”， 并 分 别 输入 到 QUARTER() 和 YEAR() ， 再 拼接 结果 。 确 实 ， 有 时 我 们 需要 自己 来 实 
现 一 些 MySQL 和 MariaDB 没有 提供 的 选项 。 不 过 ， 官 方 还 是 会 偶尔 补 上 新 功能 的 。 如 果 
没有 ， 那 就 自己 写 些 复杂 的 SQL 语句 吧 。 


11.7 比较 日 期 和 时 间 


我 们 已 经 在 本 书 的 一 些 例子 中 看 过 儿 个 比较 日 期 和 时 间 的 方法 。 其 实 这 种 事情 是 可 以 用 函 
数 来 解决 的 。 其 中 ， 最 直接 的 就 是 DATEDIFF() 和 TIMEDIFF()。 有 了 它们 ， 你 就 可 以 很 轻松 
地 比较 两 个 日 期 或 时 间 。 下 面 来 看 一 些 用 例 。 


humans 表 有 membership_expiration 这 一 列 ， 用 于 记录 每 个 人 的 会 员 资 格 失效 日 期 。 假 
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设 我 





们 想 在 每 个 人 的 档案 页 面 提 醒 他 们 距离 失效 日 还 有 多 少 天 ， 可 以 像 下 面 这 











DATEDIFF( ) ， 


注意 
于 执行 


与 DATEDIFF() 类 似 ，TIMEDIFF() 也 可 用 于 比较 时 间 。 


SELECT CURDATE() AS 'Today', 
DATE_FORMAT(membership_expiration, '%M %e, %Y') 
AS 'Date Membership Expires', 
DATEDIFF (membership_expiration, CURDATE()) 
AS "Days Until Expiration' 
FROM humans 
WHERE human_id = 


+----- +------------------------- +----------------------- 十 
| Today | Date Membership Expires | Days Until Expiration | 
+----- +------------------------- +----------------------- 十 
| 2014-02-13 | September 22，2013 | -144 | 
+----- +------------------------- +----------------------- + 


文 样 使 用 


， 这 里 的 DATEDIFF() 返回 了 一 个 负数 。 这 是 因为 membership_expiration 中 的 日 期 早 

CURDATE() 那 一 天 的 日 期 。 如 果 你 将 它们 互 换 ， 返 回 值 就 会 是 正 数 。 如 果 你 只 关心 
两 个 日 期 相差 多 少 天 ， 而 不 关心 哪个 更 早 ， 那 可 以 再 用 ABS() 来 将 DATEDIFF() 的 结果 转 成 
绝对 值 ， 这 样 无 论 两 个 日 期 的 顺序 如 何 ， 结 果 都 是 正 数 。 顺 便 说 一 下 ， 尽 管 这 个 
受 DATE 和 TIME 的 组 合 ， 但 在 比较 时 ，TIME 部 分 是 无 意义 的 。 























函数 可 接 


在 测试 它 之 前 ， 先 建 一 个 使 用 日 期 和 


时 间 的 表 。 假 设 我 们 决定 组 织 和 赞助 一 个 观 鸟 活动 ， 让 观 鸟 爱好 者 集合 起 来 ， 去 找寻 一 些 
有 趣 的 鸟 。 为 了 记录 相关 信息 ， 我 们 在 birdwatchers 库 中 建 一 个 birding_events 表 : 


此 表 


CREATE TABLE birding_events 
(event_id INT AUTO_INCREMENT KEY ， 
event_name VARCHAR(255), 
event_description TEXT, 
meeting_point VARCHAR(255), 
event_date DATE, 
start_time TIME); 


中 ， 我 们 最 关心 的 列 是 start_time， 即 活动 的 开始 时 间 。 现 在 ， 我 们 给 


events 增加 一 个 观 岛 活动 ， 输 入 以 下 SQL 语句 : 


现在 


INSERT INTO birding_events 

VALUES (NULL, 'Sandpipers in San Diego ' ， 

"Birdwatching Outing in San Diego to Look for Sandpipers, 

Curlews, Godwits, Snipes and other shore birds. 

Birders will walk the beaches and surrounding area in groups of six. 

A light Lunch will be provided.", 

"Hotel del Coronado, the deck near the entrance to the restaurant.", 
'2014-06-15', '09:00:00'); 


可 以 开始 试用 TIMEDIFF() 了 。 输 入 以 下 语句 ， 判 断 活动 还 有 多 久 才 开始 : 


SELECT NOW(), event_date, start_time, 

DATEDIFF (event_date, DATE(NOW())) AS 'Days to Event', 
TIMEDIFF(start_time, TIME(NOW())) AS 'Time to Start' 
FROM birding_events; 


birding_ 
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2014-02-14 06:45:24 | 2014-06-15 | 09:00:00 | 121 | 02:14:36 


+-------- +------------ +---- +- -i 4- + 


该 活动 会 在 此 SQL 语句 执行 后 的 121 天 2 小 时 14 分 36 秒 后 开始 。 这 个 结果 是 对 的 ， 但 


Time 


to Start 所 显示 的 样式 看 上 去 就 像 是 一 天 中 的 某 个 时 间 点 ， 而 不 像 是 一 种 计数 。 所 





以 ， 我 们 决定 用 DATE_FORMAT() 使 它 更 美观 。 另 外 ， 也 用 CONCAT() 将 它 和 天 数 放 在 一 起 : 


SELECT NOW(), event_date, start_time, 
CONCAT( 


DATEDIFF(event_date, DATE(NOW())), ' Days, '， 
DATE_FORMAT(TIMEDIFF(start_time, TIME(NOW())), '%k hours, %i minutes')) 
AS 'Time to Event' 


FROM birding_events; 


4- +---- +------ +- + 


NOW() | event date |start time| Time to Event | 


4- +---- +------ +- + 


2014-02-14 06:46:25 | 2014-06-15 | 09:00:00 | 121 Days, 2 hours, 13 minutes | 


4- +----- +---------- +- + 


要 想 使 这 条 SQL 语句 正确 执行 ， 你 得 认真 检查 括号 的 数量 。 这 里 ，NOW() 被 娩 在 DATE() 和 
TIME() 中 ， 而 DATE() 和 TIME() 又 分 别 被 能 在 DATEDIFF() 和 TIMEDIFF() 中 ， 这 样 ， 我 们 才 
能 得 出 当前 日 期 和 时 间 与 start_time 的 差异 。 然 后 ， 用 DATE_FORMAT() 将 TIMEDIFF() 格式 
化 ， 最 后 ， 用 CONCAT() 将 两 个 时 间 差 拼接 起 来 。 

试 过 这 个 SQL 语句 之 后 ， 我 们 觉得 将 日 期 和 时 间 保 存在 一 列 中 会 更 简单 。 而 我 在 本 章 的 第 
一 节 说 过 ， 我 们 会 介绍 如 何 改变 时 间 列 的 类 型 。 现 在 就 来 看 看 。 再 建 一 列 event_datetime， 
类 型 为 DATETIME: 



































ALTER TABLE birding_events 
ADD COLUMN event_datetime DATETIME; 


这 一 列 可 用 来 保存 日 期 和 时 间 。 现 在 将 开始 日 期 和 开始 时 间 合 到 一 起 ， 输 到 这 列 中 : 


UPDATE birding_events 
SET event_datetime = CONCAT(event_date,SPACE(1), start_time); 


CONCAT() 用 于 将 日 斯 和 时 间 拼 接 起 来 。 然 后 ，MySQL 会 自动 将 拼接 结果 从 字符 串 转 成 时 


间 值 ， 






































再 写 进 event_datetime。 我 们 来 执行 一 条 SELECT 语句 ， 看 看 结果 如 何 : 


SELECT event_date, start_time, event_datetime 
FROM birding_events; 


+----- +----- +--------------------- + 
| event date | start time | event datetime | 
+----- +----- +--------------------- 十 
| 2014-06-15 | 09:00:00 | 2014-06-15 09:00:00 | 
+---- +----- +--------------------- + 


更 新 成 功 。 用 这 一 列 再 计算 一 次 活动 还 有 多 久 才 开始 : 
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SELECT NOW(), event_datetinme, 
CONCAT(DATEDIFF(event_datetime, NOW() ), ' Days, '， 
TIME_FORMAT( TIMEDIFF( TIME(event_datetime), CURTIME() )， 
'%k hours, %i minutes') ) 
AS 'Time to Event' 
FROM birding_events; 


+--------------------- +--------------------- +------------------------------- 十 
| NOW() | event_datetime | Time to Event 

+--------------------- +--------------------- +------------------------------- 十 
| 2014-02-14 05:48:55 | 2014-06-15 09:00:00 | 121 Days, 3 hours, 11 minutes | 
+--------------------- +--------------------- +------------------------------- 十 


看 起 来 没什么 问题 ， 而 且 ， 这 样 比分 成 两 列 更 好 。 因 为 原来 的 两 列 已 没什么 用 了 ， 所 以 ， 
可 以 将 birding_events 的 event_date 和 start_time 去 掉 : 








ALTER TABLE birding_events 
DROP COLUMN event_date, 
DROP COLUMN start_ time; 


至 此 ， 我 们 已 经 顺利 将 分 开 的 两 列 日 期 和 时 间 合 成 一 列 。 你 一 开始 可 能 就 打算 建 一 列 而 不 
是 两 列 ， 正 如 上 面 那些 例子 。 但 是 ， 你 无 法 保证 总 能 选择 正确 。 因 此 ， 我 才 想 带 你 走 一 志 
这 个 合并 日 期 和 时 间 的 流程 ， 让 你 具备 一 定 经 验 。 


11.8 小结 


本 章 几 乎 讲 遍 了 MySQL 和 MariaDB 中 所 有 的 日 期 和 时 间 函 数 。 剩 下 没 讲 的 并 不 多 ， 这 其 
中 包括 了 一 些 别名 (例如 ，DATE_ADD() 的 别名 ADDDATE()，DATE_SUB() 的 别名 SUBDATE())， 
以 及 一 些 特殊 用 途 的 函数 ， 你 可 以 在 需要 用 到 它们 的 时 候 再 去 了 解 。 总 之 ， 你 所 学 的 知识 
会 让 你 受用 多 年 。 

我 们 之 所 以 要 讲 这 么 多 日 期 和 时 间 函 数 ， 主 要 是 因为 日 期 和 时 间 是 人 们 在 日 常生 活 中 很 关 
注 的 问题 ， 例 如 入 们 总 是 想 知 道 一 件 事情 何 时 发 生 过 ， 发 生 了 多 久 ， 或 何 时 才 会 发 生 ， 人 
们 需要 约定 时 间 。 因 此 ， 日 期 和 时 间 信 息 就 成 为 了 数据 库 中 很 重要 的 一 部 分 。 必 须 熟悉 日 
甚 和 时 间 函 数 ， 以 便 在 解决 问题 时 信和 手 牛 来 。 为 了 达到 这 种 境界 ， 请 做 完 本 章 习 题 ， 它 们 
会 令 你 对 本 章 内 容 的 印象 更 加 深刻 。 


11.9 习题 


以 下 习题 会 用 到 日 期 和 时 间 国 数 ， 以 及 第 10 章 介 绍 的 一 些 字符 串 函 数 。 其 中 有 些 还 会 需 
要 你 用 UPDATE 来 改变 表 中 的 数据 。 通 过 使 用 日 期 和 时 间 函 数 来 更 新 数据 ， 你 会 更 好 地 理解 
这 些 函 数 的 能 力 。 可 参考 第 8 章 中 UPDATE 的 用 法 。 

(1) 写 一 条 SQL 语句 ， 筛 选 出 humans 表 中 的 英国 用 户 。 查 出 姓 和 名 ， 并 拼接 起 来 。 另 外 ， 
也 查 出 注册 日 和 过 期 日 。 用 DATE_FORMAT() 将 所 有 日 期 显示 成 类 似 这 样 的 格式 : Sun.， 
Feb. 2，1979。 注 意 不 要 漏 掉 标点 符号 ( 即 缩写 词 后面 的 句号 和 喜 号 ,但 年 份 后 不 需要 
句号 和 逗号 )。 格 式 代码 可 参考 表 11-2。 
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写 完 后 ， 执 行 语句 并 得 出 结果 ， 检 查 结果 是 否 正 确 。 若 不 正确 ， 改 到 正确 为 止 。 

(2) 写 一 个 SELECT， 查 出 会 员 的 名 单 和 会 员 资格 的 过 期 日 ， 要 求 结 果 集 按 membership_ 
expiration 列 排 序 。 然 后 使 用 UPDATE 修改 membership_expiration。 用 ADDDATE() 将 
过 期 日 延 后 1 个 月 又 15 天， 要 求 只 对 2014 年 6 月 30 日 后 过 期 的 会 员 操 作 。 日 期 和 
时 间 代 码 可 参考 表 11-1。 你 还 需要 在 WHERE 中 用 字符 串 。 写 完 后 ， 再 执行 一 次 刚才 的 
SELECT， 并 比较 两 个 结果 集 ， 确 保 只 改 了 该 改 的 人 ， 并 且 改 的 日 期 也 正确 。 
延期 后 ， 用 DATESUB() 将 那 一 部 分 用 户 的 过 期 日 提早 5 天 。 改 完 后 ， 再 执行 一 次 
SELECT， 与 上 一 次 SELECT 的 结果 对 比 一 下 。 

再 改 改 过 期 日 ， 但 这 次 用 ADD_DATE() 来 将 过 期 日 提早 10 天 。 注 意 ， 你 得 用 负 值 作 参 
数 。 改 完 之 后 ， 再 执行 SELECT 一 次 看 改 得 是 否 正 确 。 

(3) 在 11.6 节 中 ， 我 们 建 了 一 个 bird_identification_tests 表 ， 并 录入 了 一 行 数据 来 进 
行 测试 。 现 在 ， 给 该 表 揪 入 至 少 五 行 。 这 些 记 录 需 与 另外 两 个 human_id 和 其 他 bird_ 
id 关联 。 录 入 时 ， 像 那 一 节 里 所 做 的 ， 用 CURTIME() 填充 id_start 列 ， 而 id_end 列 
则 填 NULL。 接 着 ， 为 了 再 用 CURTIME() 填充 id_end 列 ， 在 每 次 INSERT 后 都 执行 一 次 
UPDATE， 这 样 两 列 的 时 间 就 会 不 同 了 。 注 意 每 次 INSERT 和 UPDATE 需 间 隔 一 定时 间 。 
录入 完毕 之 后 ， 用 一 个 含有 TIMEDIFF() 的 SELECT 查 出 每 条 记录 的 id_start 和 id_end 
的 时 间 间 隔 。 注 意 TIMEDIFF() 的 参数 顺序 ， 使 结果 不 要 出 现 负数 。 然 后 ， 再 加 入 每 个 
会 员 的 名 。 这 需要 用 到 JOIN (9.2 节 介 绍 过 它 的 用 法 )。 

(4 再 写 一 条 SELECT， 要 求 查 出 birds 表 的 common_name， 以 及 birdwatchers 表 的 id_start 

和 id_end。 使 用 TIMEDIFF() 计算 两 列 在 时 间 上 的 差异 。 进 行 表 连接 时 ， 记 住 要 调整 
JOIN， 反 映 两 个 表 在 不 同 的 数据 库 中 。 写 完 后 执行 一 下 ， 检 查 是 否 正确 。 然 后 ， 加 上 
GROUP BY， 按 bird_id 分 组 ， 将 TIMEDIFF() 包 在 AvG() 中 ， 以 计算 平均 值 。 给 该 值 起 一 
个 类 似 Avg.， Time 这 样 的 别名 。 改 完 后 运行 看 看 结果 。 其 中 平均 值 应 该 有 四 位 小 数 〈 例 
如 2 分 19 秒 显示 为 219.0000) 。 
接着 ， 重 写 该 SELECT， 将 四 位 小 数 的 时 间 改 成 TIME 格式 。 首 先 你 需要 用 TRIM()， 带 上 
TRAILLING 选项 和 .9996 字符 串 ， 将 小 数位 去 掉 。 然 后 运行 一 遍 看 结果 怎样 。 接 着 再 用 
LPAD() 包 住 它 ， 给 左边 补 0， 使 其 变 成 hhmmss 的 格式 。 之 后 ， 再 运行 一 次 SELECT 检查 
一 下 。 这 两 个 字符 串 函 数 在 10.1.3 节 中 都 讲 过 。 
最 后 ， 用 STR_TO_DATE 将 补 0 后 的 字符 串 (如 000219) 转换 成 时 间 。 想 拼 出 hhmmss 这 
样 的 格式 代码 ， 可 参考 表 11-2。 如 果 你 只 提供 时 间 的 格式 代码 ， 则 STR_TO_DATE() 只 会 
转换 出 时 间 ， 而 这 正 是 我 们 现在 想 要 的 。 执 行 该 SELECT， 确 保 结果 无 误 。 若 有 误 ， 则 
修改 至 无 误 。 

(5) 重 写 上 题 最 后 你 成 功 构 建 的 那个 SELECT。 将 平均 值 放 到 DATE_FORMAT() 中 。 把 格式 改 
成 : 01 minute(s)，21 seconds。 改 完 后， 执行 看 看 。 附 加 题 : 用 一 个 字符 串 函 数 把 分 
钟 数 和 秒 数 前 的 0 去掉。 用 IF() 来 判断 是 否 需要 给 minute 和 second 加 s。 
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第 12 章 


罕 合 函数 和 数值 函数 





数据 库 经 常 需要 与 数字 打交道 ， 总 有 求 值 、 统 计 或 计算 的 需求 。 有 时 ， 你 也 可 能 想 将 计算 
结果 四 舍 五 和 成 自己 喜欢 的 样式 。 为 此 ，MySQL 和 MariaDB 提供 了 一 些 数 字 和 算术 函数 。 
其 中 有 些 还 被 称 为 聚合 函数 。 本 章 将 会 介绍 很 多 数值 国 数 ， 以 及 大 部 分 聚合 国 数 ， 但 并 不 
包括 那些 与 统计 相关 的 高 级 函数 ， 或 者 那些 与 微 积分 和 几何 相关 的 数学 函数 。 我 们 讲 的 都 
是 最 有 用 和 最 常用 的 一 些 函 数 ， 剩 下 的 那些 ， 如 果 你 实在 有 需要 ， 可 自行 研究 。 


12.1 ”聚合 函数 


对 数据 库 中 的 数据 进行 统计 ， 能 得 出 一 些 有 用 的 信息 。 如 果 数 据 库 中 保存 了 一 个 组 织 机 构 
的 各 种 活动 信息 ， 那 么 我 们 可 以 对 这 些 信息 进行 统计 分 析 。 例 如 ， 如 果 数 据 库 保存 了 商品 
销售 情况 的 相关 数据 ， 那 么 我 们 可 以 通过 统计 来 制定 一 些 营 销 策略 。 

同 理 ， 在 birdwatchers 数据 库 中 运用 聚合 国 数 ， 我 们 就 可 以 了 解 观 鸟 网 会 员 的 使 用 习惯 ， 
得 知 他 们 参与 了 什么 事件 ， 或 其 他 什么 活动 。 而 在 rookery 库 中 ， 则 可 以 得 出 鸟 类 的 相关 
信息 。 这 有 助 于 会 员 在 野外 找 鸟 ， 或 者 帮助 他 们 了 解 乌 类 的 生存 状况 。 我 们 也 可 以 通过 这 
些 数据 统计 出 会 员 都 在 哪些 地 方 发 现 过 鸟 类 。 

本 节 就 来 看 看 能 求 出 这 些 信 息 的 聚合 函数 。 为 了 将 数据 集合 在 一 起 进行 分 类 统计 ， 我 们 有 
时 候 需 要 用 到 GROUP BY。 而 有 些 聚 合 函 数 ， 如 前 几 音 用 于 统计 表 中 行 数 的 COUNT()， 不 需 
要 与 GROUP BY 一 起 使 用 (至 少 某 些 情况 是 不 需要 的 )。 我 们 就 先 看 看 COUNT() ， 然 后 再 看 其 
他 一 些 简单 的 统计 函数 ， 例 如 平均 值 函数 。 


12.1.1 计数 
计数 是 最 简单 的 计算 之 一 。 我 们 在 小 时 候 刚 刚 接触 数学 时 就 会 学 到 。 所 以 ， 现 在 就 先 从 计 
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数 函 数 COUNT() 开始 吧 。 
假设 我 们 想 知道 birds 表 含 有 多 少 种 鸟 ， 可 以 在 mysql 中 输入 以 下 语句 : 


SELECT COUNT(*) 
FROM birds; 


+---------- + 
| COUNT(*) | 
+---------- + 
| 28891 | 
+---------- + 





注意 ， 这 里 不 需要 GROUP BY。 那 是 因为 我 们 想 查 出 整个 表 的 行 数 ， 而 不 是 对 表 中 数据 进行 
分 组 后 的 各 组 的 行 数 一 一 换 句 话说 ， 整 个 表 就 是 一 组 。 另 外 也 请 注意 ， 我 们 用 了 一 个 星 号 
作为 COUNT() 的 参数 。 星 号 是 通配符 ， 指 示 MySQL 统计 所 有 查 出 的 行 。 因 为 该 SQL 语句 
没有 加 WHERE， 所 以 选择 的 行 就 是 整个 表 的 行 。 

有 不 少 岛 种 没有 俗名 ， 所 以 在 birds 表 中 ， 它 们 的 common_name 为 空 。 而 COUNT() 有 这 样 一 
个 规定 : 如 果 参 数 是 列 名 而 非 星 号 ， 则 它 只 会 对 非 NULL 的 行进 行 计数 。 我 们 可 以 改 改 数 
据 ， 看 看 不 同 的 参数 会 有 怎样 的 结果 。 输 入 以 下 两 条 SQL 语句 : 

UPDATE birds 


SET common_name = NULL 
WHERE common_name = ”"; 





SELECT COUNT(common_name) 
FROM birds; 


+-------------------- + 
| COUNT(common_name) | 
+-------------------- + 
| 9553 | 
+-------------------- 十 





这 就 是 表 中 有 俗名 的 岛 的 数目 。 其 实 不 用 修改 数据 ， 用 WHERE 也 可 以 得 出 这 一 结果 。 那 样 
就 需要 限定 只 查 出 common_name 不 等 于 '' 的 行 。 不 过 ， 我 们 已 经 将 所 有 “'' 更 新 成 NULL， 
所 以 ， 现在 只 能 根据 NULL 来 写 WHERE 了 : 


SELECT COUNT(*) FROM birds 
WHERE common_name IS NULL; 








+---------- + 
| COUNT(*) | 
+---------- + 
| 19338 | 
+---------- + 


数目 不 同 了 ， 因 为 我 们 计算 的 是 common_name 为 NULL 的 行 一 一 用 了 IS NULL 运算 符 。 而 
之 前 计算 的 是 common_name 非 NULL 的 行 。 要 算出 这 些 非 NULL 的 行 ， 需 要 将 WHERE 按 如 
下 修改 : 
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SELECT COUNT(*) FROM birds 
WHERE common_name IS NOT NULL; 


+---------- + 
| COUNT(*) | 
+---------- + 
| 9553 | 
+---------- + 


只 需 改 成 IS NOT NULL， 就 与 之 前 一 样 了 。 
COUNT() 还 有 其 他 不 错 的 用 法 ， 现 在 就 来 玩 一 玩 。 试 试 统计 每 科 的 鸟 种 数量 。 这 需要 用 到 
GROUP BY，SQL 语句 如 下 : 


SELECT COUNT(*) 
FROM birds 
GROUP BY family_id; 











ii| 








+---------- + 
| COUNT(*) | 
+---------- + 
| 5 | 
| 6 | 
| 248 
| 119: 
| 168 
| 39 | 
| 223 
| | 
+---------- + 


227 rows in set (0.15 sec) 


此 例 中 ， 我 们 告诉 MySQL 要 按 family_id 进行 GROUP BY 操作。 所 以 ， 它 就 按 family_id 
对 所 有 行进 行 分 组 ， 然 后 统计 每 一 组 的 行 数 。 因 为 结果 会 有 227 行 ， 所 以 我 省 略 了 一 些 ， 
以 节省 空间 。 这 条 SQL 语句 运行 正常 ， 但 出 来 的 结果 没什么 用 。 如 果 结 果 集 中 还 有 科 名 ， 
那 就 好 了 。 于 是 ， 我 们 用 JOIN 来 连接 bird_families 表 : 

SELECT bird_famiLies.scientific_name AS 'Bird Family', 

COUNT(*) AS 'Number of Species' 


FROM birds JOIN bird_families USING(family_id) 
GROUP BY birds.family_id; 























+-------------------- +------------------- + 
| Bird Family | Number of Species | 
+-------------------- +------------------- 十 
| Gaviidae | 6 
| Anatidae | 248 | 
| Charadriidae | 119 | 
| Laridae | 168 | 
| Sternidae | 39 | 
| Caprimulgidae | 223 | 
| Sittidae | 92 | 
| | | 
+-------------------- +------------------- 十 





了 
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SS 


225 rows in set (0.17 sec) 


这 看 起 来 好 多 了 ， 结 果 也 更 有 意思 了 。 同 样 ， 我 省 略 了 部 分 结果 。 不 过 ， 你 要 注意 ， 这 
次 总 共 只 有 225 行 。 那 是 因为 birds 表 中 有 些 行 的 fanily_id 是 NULL。 在 使 用 数据 库 
的 过 程 中 ， 要 留意 这 些 差 异 。 不 要 因为 你 不 是 在 排查 问题 就 忽略 它们 ， 事 实 上 ， 这 就 是 
一 个 问题 。 
现在 来 修改 SELECT， 使 其 返回 在 bird_families 中 找 不 到 匹配 记录 的 行 数 。 这 需要 使 用 
LEFT JOIN (我 们 在 9.2.1 市 中 举 过 例子 ， 这 里 再 讲 一 次 ) : 

SELECT bird_families.scientific_ name AS 'Bird Family', 

COUNT(*) AS 'Number of Species' 


FROM birds LEFT JOIN bird_families USING(family_id) 
GROUP BY birds.family_id; 












































+-------------------- +------------------- 十 
| Bird Family | Number of Species | 
+-------------------- +------------------- 十 
| NULL | 4 | 
| NULL | 1 | 
| Gaviidae | 6 | 
| Anatidae | 248 | 
| Charadriidae | 119 | 
| Laridae | 168 | 
| Sternidae | 39 | 
| Caprimulgidae | 223 | 
| Sittidae | 92 | 
| . | | 
+-------------------- +------------------- 十 


225 rows in set (0.17 sec) 


从 结果 可 以 看 出 ，birds 表 中 有 些 行 的 fanily_id 为 NULL， 有 一 行 的 family_id 在 bird_ 
families 中 没有 记录 。 虽 然 我 们 可 以 再 写 一 个 SELECT I 但 这 偏离 了 学 
函数 的 目的 。 所 以 ， 就 让 我 们 假设 这 个 问题 已 经 解决 ， 并 回 到 聚合 函数 的 话题 上 。 


你 可 能 已 经 发 现 ， 在 前 两 个 例子 的 结果 中 ， 科 名 没有 按 字母 序 显示 。 这 是 因为 ，GROUP BY 
是 根据 它 所 带 的 列 名 来 排序 的 (这 两 个 例子 用 的 都 是 fanily_id)。 如 果 想 按 科 名 (bird_ 
families 表 的 scientific_name) 来 排 ， 就 需要 改动 GROUP BY 子 句 。 试 试 输入 以 下 语句 : 
SELECT bird_families.scientific_ name AS 'Bird Family', 
COUNT(*) AS 'Number of Species' 


FROM birds LEFT JOIN bird_families USING(family_id) 
GROUP BY bird_families.scientific_name; 












































+-------------------- +------------------- 十 
| Bird Family | Number of Species | 
+-------------------- +------------------- 十 
| Acanthisittidae | 9 | 
| Acanthizidae | 238 | 
| Accipitridae | 481 | 
| Acrocephalidae | 122 | 





| Aegithalidae | 49 | 
| Aegithinidae | 20 | 
| Aegothelidae | 21, | 
| Alaudidae | 447 | 
| | | 
+-------------------- +------------------- + 














这 已 经 好 多 了 ， 但 如 果 能 在 结果 集 的 底部 显示 记录 的 总 数 ， 就 更 好 了 。 可 以 用 另 一 条 
SQL 语句 来 求 总 数 ， 而 如 果 想 在 同一 条 SQL 语句 中 求 出 ， 则 可 在 GROUP BY 中 加 上 WITH 
ROLLUP , 














SELECT bird_families.scientific name AS 'Bird Family', 
COUNT(*) AS 'Number of Species' 

FROM birds JOIN bird_families USING(family_id) 

GROUP BY bird_families.scientific_name WITH ROLLUP; 


+-------------------- +------------------- 十 
| Bird Family | Number of Species | 
+-------------------- +------------------- 十 
| Acanthisittidae | 9 | 
| Acanthizidae | 238 | 
| Accipitridae | 481 | 
| Acrocephalidae | 122 | 
| Aegithalidae | 49 | 
| Aegithinidae | 20 | 
| Aegothelidae | 21 | 
| Alaudidae | 447 | 
| ... | | 
| NULL | 28891 | 
+-------------------- +------------------- 十 


























这 样 ， 结 果 集 的 最 后 一 行 就 显示 了 记录 的 总 数 ， 它 也 确实 与 本 节 的 第 一 个 例子 的 结果 
样 。 该 行 第 一 个 域 的 NULL 不 是 指 它 的 family_id 不 匹配 ， 而 是 因为 它 是 所 有 组 的 总 数 ， 











没有 特定 的 组 名 ， 所 以 MySQL 就 使 用 了 NULL。 不 过 ， 我 们 可 以 自己 做 些 调 整 ， 使 得 它 
有 值 。 在 修改 的 同时 ， 顺 便 也 统计 每 个 目 所 含 鸟 种 的 数量 : 

SELECT IFNULL( bird_orders.scientific _ name, '') AS 'Bird Order', 

IFNULL( bird_families.scientific name, 'Total:') AS 'Bird Family', 

COUNT(*) AS 'Number of Species' 

FROM birds 

JOIN bird_families USING(family_id) 

JOIN bird_orders USING(order_id) 

GROUP BY bird_orders.scientific name, bird_families.scientific_name 

WITH ROLLUP; 

+--------------------- +-------------------- +------------------- 十 

| Bird Order | Bird Family | Number of Species | 

+--------------------- +-------------------- +------------------- 十 

| Anseriformes | Anhimidae | 3 

| Anseriformes | Total: | 3 

| Apodiformes | Apodidae | 316 | 

| Apodiformes | Hemiprocnidae | 16 | 

| Apodiformes | Trochilidae | 809 | 
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| Apodiformes | Total: | 1141 | 
| Caprimulgiformes | Aegothelidae | 21 | 
| Caprimulgiformes | Caprimulgidae | 224 | 
| Caprimulgiformes | Nyctibiidae | 17 | 
| Caprimulgiformes | Podargidae | 26 | 
| | | | 
| | Total | 28890 | 
+--------------------- +-------------------- +------------------- 十 


除了 增加 一 个 域 来 显示 每 个 目 中 鸟 种 的 数量 ， 我 们 还 使 用 了 IFNULL() 来 处 理 目 名 和 科 
名 。 这 个 函数 会 告诉 MySQL， 如 果 该 域 返回 NULL 值 ， 则 替换 成 我 们 另外 给 的 值 或 字符 
串 一 一 在 这 里 ， 可 能 出 现 NULL 的 就 是 统计 数 以 外 的 列 。 因 为 我 们 的 SQL 语句 先 按 科 、 
后 按 目 来 做 统计 ， 所 以 结果 是 对 的 。 


此 语句 的 效果 虽然 不 算 很 厉害 ， 却 能 方便 地 与 脚本 组 合 ， 在 网 页 上 显示 查询 结果 。 可 以 用 
应 用 编程 接口 来 检查 总 数 的 值 : 在 第 二 个 域 ， 然 后 调整 它 。 也 可 以 用 应 用 编程 接口 的 脚本 
来 做 这 些 简单 的 计算 ， 而 不 是 让 MySQL 来 做 。 但 有 了 时候， 在 数据 库 系 统 层 做 会 比较 好 。 
这 是 因为 ， 我 常 发 现 这 样 会 更 加 紧凑 、 更 易于 维护 。 好 了 ， 说 这 么 多 已 经 够 了 ， 我 们 来 继 
续 学 习 COUNT() 以 外 的 聚合 函数 。 


12.1.2 ”对 一 组 数据 进行 运算 
我 们 在 第 11 章 建 过 一 个 叫 bird_identification_tests 的 表 ， 用 于 记录 会 员 在 网 上 做 的 
“ 岛 类 识别 测试 ”的 情况 。 现 假设 我 们 想 告知 会 员 他 们 测试 所 花 时 间 的 平均 值 。 一 种 简单 
的 算法 就 是 ， 把 每 次 的 时 间 (用 id_end 减 去 id_start) 加 总 ， 然 后 除 以 测试 次 数 。 而 要 实 
现 加 总 ， 可 以 用 SUM()。 


不 过 ， 在 继续 之 前 ， 先 看 看 其 中 一 个 会 员 的 测试 记录 ， 再 决定 怎样 做 。 我 们 使 用 
TIMEDIFF() 来 比较 测试 的 开始 时 间 和 结束 时 间 (这 在 11.7 节 中 介绍 过 ) : 


SELECT common_name AS 'Bird', 

TIME_TO_SEC( TIMEDIFF(id_end, id_start) ) 

AS 'Seconds to Identify' 

FROM bird_identification_tests 

JOIN humans USING(human_id) 

JOIN rookery.birds USING(bird_id) 

WHERE name_first = 'Ricky' AND name_Last = 'Adams'; 





































































































+-------------------- +--------------------- + 
| Bird | Seconds to Identify | 
+-------------------- +--------------------- + 
| Crested Shelduck | 81 | 
| Moluccan Scrubfowl | 174 | 
| Indian Pond-Heron | 181 | 
+-------------------- +--------------------- + 


因为 需要 先 将 每 次 测试 的 时 间 加 总 ， 再 求 平 均值 ， 所 以 我 们 得 用 TIME_TO_SEC() 把 
TIMEDIFF() 的 结果 转换 成 秒 数 ， 如 把 121 ( 即 1 分 21 秒 ) 转换 成 81 秒 。 接 着 ， 再 多 做 
步 ， 以 更 好 地 理解 时 间 函 数 和 SUM() 的 用 途 : 
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SELECT CONCAT(name_first, SPACE(1), name_last) 
AS 'Birdwatcher', 
SUM(TIME_TO_SEC( TIMEDIFF(id_end, id_start) ) ) 
AS 'Total Seconds for Identifications"' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
WHERE name_first = 'Ricky' AND name_Last = 'Adams'; 


+---- 4 + 
| Birdwatcher | Total Seconds for Identifications | 
+---- 4 + 
| Ricky Adams | 436 | 
+---- +- + 


这 就 是 Ricky Adams 三 次 测试 的 总 秒 数 。 注 意 ，SUM() 也 是 一 个 不 必 与 GROUP BY 一 起 使 用 
的 聚合 函数 。 接 着 ， 再 改 改 SQL 语句 ， 以 计算 平均 人 (将 436 秒 除 以 3) 。 我 们 试 试 用 两 
个 子 查 询 ， 分 别 查 出 436 和 3。 这 种 写法 复杂 而 且 低 效 ， 不 用 跟着 做 ， 看 看 就 好 : 


SELECT Identifications, Seconds, 
(Seconds / Identifications) AS 'Avg. Seconds/Identification' 
FROM 
( SELECT human_id, COUNT(*) AS 'Identifications"' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
WHERE name_first = 'Ricky' AND name_Last = 'Adams') 
AS row_count 
JOIN 
( SELECT human_id, CONCAT(name_first, SPACE(1), name_last) 
AS 'Birdwatcher', 
SUM(TIME_TO_SEC(TIMEDIFF(id_end, id_start))) 
AS "Seconds' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) ) 
AS second_count 
USING(human_id); 

















+----------------- +--------- +- + 
| Identifications | Seconds | Avg. Seconds/Identification | 
+----------------- +--------- +- + 
| 3 436 | 145.3333 | 
+----------------- +--------- +- + 
这 写 起 来 很 费劲 ， 应 该 有 更 简单 实 就 是 使 用 AVG()， 现 在 改 























用 它 试 试 : 

SELECT CONCAT(name_first, SPACE(1), name_last) 
AS 'Birdwatcher', 

AVG( TIME_TO_SEC( TIMEDIFF(id_end, id_start)) ) 
AS 'Avg. Seconds per Identification' 

FROM bird_identification_tests 

JOIN humans USING(human_id) 
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JOIN rookery.birds USING(bird_id) 
WHERE name_first = 'Ricky' AND name_Last = 'Adams'; 


+---- 4 + 
| Birdwatcher | Avg. Seconds per Identification | 
+---- 4 + 
| Ricky Adams | 145.3333 | 
+---- 4 + 




















这 样 就 简单 得 多 了 ， 而 且 不 需要 用 到 子 查询 。 若 再 去 掉 WHERE， 就 可 以 查 出 所 有 会 员 的 平 
均值 。 下 面 就 来 改 改 ， 并 将 时 间 格 式 改 成 分 钟 和 秒 ， 同 时 也 将 测试 次 数 显示 出 来 。 时 间 格 
式 的 更 改 ， 会 用 到 SEC_TO_TIME() ， 它 会 将 TIME_TO_SEC() 和 AVG() 算出 的 平均 秒 数 变 回 时 
间 格 式 : 





























SELECT CONCAT(name_first, SPACE(1), name_last) 
AS 'Birdwatcher', 
COUNT(*) AS 'Birds', 
TIME_FORMAT( 
SEC_TO_TIME(AVG( TIME_TO_SEC( TIMEDIFF(id_end, id_start)))), 
'%i:%s' ) 
AS 'Avg. Time' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
GROUP BY human_id LIMIT 3; 


+--- +------- +----------- 十 
| Birdwatcher | Birds | Avg. Time | 
+--- +------- +----------- + 
| Rusty Osborne | 2 | 01:59 | 
| Lexi HoLLar | 3 | 00:23 | 
| Ricky Adams | 3 | 02:25 | 
+--- +------- +----------- + 





这 次 我 们 查 了 三 个 会 员 。 另 外 ， 也 查 出 他 们 各 自 所 做 的 测试 次 数 。 而 且 ， 平 均 时 间 的 格式 
也 更 美观 了 。 从 结果 可 以 看 出 ，Ricky Adams 的 平均 时 间 比 Lexi Hollar 的 长 得 多 。 这 可 能 





是 


因为 Lexi Hollar 确实 做 得 比较 快 ， 又 或 者 是 Ricky Adams 做 的 时 候 分 神 了 吧 。 











因为 使 用 了 LIMIT， 所 以 看 不 出 谁 的 平均 时 间 最 长 ， 以 及 谁 做 得 最 快 。 如 果 想 知道 的 话 ， 
可 以 去 掉 LIMIT， 然 后 将 整 条 SQL 语句 作为 另 一 条 SQL 语句 的 子 查 询 ， 并 在 那 一 条 SQL 
语句 中 使 用 ORDER BY。 也 就 是 说 ， 使 内 部 的 SQL 语句 返回 所 有 会 员 的 平均 时 间 列 表 ， 然 
后 用 外 部 的 SQL 语句 将 该 列表 按 我 们 想 要 的 顺序 来 排列 : 

















SELECT Birdwatcher, avg_time AS 'Avg. Time' 
FROM 
(SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
COUNT(*) AS 'Birds', 
TIME_FORMAT( SEC_TO_TIME( AVG( 
TIME_TO_SEC( TIMEDIFF(id_end, id_start))) 
),'%i:%s' ) AS 'avg_time' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
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GROUP BY human_id) AS average_times 
ORDER BY avg_time; 


+------------------- +----------- + 
| Birdwatcher | Avg. Time | 
+------------------- +----------- 十 
| Lexi HoLLar | 00:23 

| Geoffrey Dyer | 00:25 | 
| Katerina Smirnova | 00:48 | 
| Rusty Osborne | 01:59 | 
| Ricky Adams | 02:25 

| Anahit Vanetsyan | 03:20 | 
+------------------- +----------- 十 











这 样 就 能 看 到 ，Lexi Hollar 是 最 快 的， 而 Anahit Vanetsyan 是 最 慢 的 。 因 为 一 般 无 法 # 











GROUP BY 和 ORDER BY 放 在 同一 条 SQL 语句 中 ， 所 以 我 们 只 能 用 一 个 子 查 询 。 








【=| 


如 果 不 需 要 知道 具体 的 人 名 ， 那 么 可 以 直接 用 MAX() 和 MIN()。 现 在 就 来 用 这 两 个 聚合 函 


数 修改 上 例 : 


SELECT MIN(avg_time) AS 'Minimum Avg. Time', 
MAX(avg_time) AS 'Maximum Avg. Time' 
FROM humans 
JOIN 

(SELECT human_id, COUNT(*) AS 'Birds', 

TIME_FORMAT( 

SEC_TO_TIME( AVG( 
TIME_TO_SEC( TIMEDIFF(id_end, id_start))) 
)，'%i:%s' ) AS 'avg_time' 

FROM bird_identification_tests 

JOIN humans USING(human_id) 

JOIN rookery.birds USING(bird_id) 

GROUP BY human_id ) AS average_times; 


+------------------- +------------------- 十 
| Minimum Avg. Time | Maximum Avg. Time | 
+------------------- +------------------- 十 
| 00:23 | 93:20 

+------------------- +------------------- + 





与 上 例 的 结果 比较 ， 可 知 这 次 也 是 正确 的 。 如 果 想 知道 每 个 用 户 的 最 长 和 最 短 完成 时 间 ， 


而 不 是 平均 时 间 ， 可 以 使 用 如 下 语句 : 


SELECT CONCAT(name_first, SPACE(1), name_last) AS 'Birdwatcher', 
TIME_FORMAT(SEC_TO_TIME( 
MIN(TIME_TO_SEC( TIMEDIFF(id_end, id_start))) 
),%i:%s' ) AS 'Minimum Time' ， 
TIME_FORMAT(SEC_TO_TIME( 
MAX(TIME_TO_SEC( TIMEDIFF(id_end, id_start))) 
)， '%i:%s' ) AS 'Maximum Time' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
GROUP BY Birdwatcher; 
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+------------------- +-------------- +-------------- + 
| Birdwatcher | Minimum Time | Maximum Time | 
+------------------- +-------------- +-------------- + 
| Anahit Vanetsyan | 00:20 | 08:48 | 
| Geoffrey Dyer | 00:09 | 00:42 | 
| Katerina Smirnova | 00:22 | 01:02 | 
| Lexi HoLLar | 00:11 | 00:39 | 
| Ricky Adams | 01:21 | 03:01 

| Rusty Osborne | 01:50 | 02:08 | 
+------------------- +-------------- +-------------- + 


这 条 SQL 语句 显示 了 按 字母 排序 的 会 员 名 字 ， 以 及 他 们 各 自 的 最 长 和 最 短 完成 时 间 。 一 般 
来 说 ， 只 要 按 会 员 来 分 组 ， 就 可 以 对 每 个 会 员 的 记录 使 用 AvG() 和 MAX() 之 类 的 聚合 函数 。 
这 里 ， 我 们 疫 用 COUNT()。 


其 实 玩法 还 有 很 多 。 我 们 可 以 查询 识别 哪 种 鸟 花 的 时 间 最 长 或 最 短 。 这 样 就 可 以 知道 哪些 
岛 是 最 难 认 的 ， 并 将 它们 留 给 资深 会 员 去 做 。 我 们 甚至 可 以 考虑 ， 那 些 平均 时 间 很 短 的 
会 员 ， 是 不 是 因为 他 们 没有 抽 中 难 认 的 鸟 。 如 果 想 排除 这 些 记 录 ， 可 以 使 用 STDDEV() 和 
VARIANCE() 之 类 的 聚合 函数 来 做 一 些 高 级 的 统计 分 析 。 不 过 对 于 新 手 来 说 ， 这 些 应 该 不 太 
需要 掌握 ， 你 现在 只 需要 知道 它们 的 存在 即 可 。 


在 进入 下 一 个 话题 之 前 ， 再 看 一 个 不 涉及 时 间 值 的 MIN() 和 MAX() 的 用 例 。bird_sightings 
表 存 有 每 次 会 员 发 现 鸟 类 的 相关 信息 ， 其 中 的 Location_gps 列 是 发 现 地 的 GPS 坐标 。 它 
包含 两 个 11 位 的 数字 : 纬度 和 经 度 。 因 为 有 些 鸟 会 在 南北 之 间 迁 徙 ， 所 以 我 们 想 查 出 每 
种 鸟 的 最 南 和 最 北 的 发 现 地 。 可 以 使 用 SUBSTRING() 来 截取 出 纬度 ， 然 后 用 MAX() 得 到 最 
北 的 纬度 ， 用 MIN() 得 到 最 南 的 纬度 。 代 码 如 下 : 


SELECT common_name AS 'Bird '， 
MAX(SUBSTRING(Location_gps，1，11)) AS 'Furthest North ' ， 
MIN(SUBSTRING(Location_gps，1，11)) AS 'Furthest South' 
FROM birdwatchers.bird_sightings 

JOIN rookery.birds USING(bird_id) 

WHERE location_gps IS NOT NULL 

GROUP BY bird_id LIMIT 3; 










































































+----------------- +---------------- +---------------- 十 
| Bird | Furthest North | Furthest South | 
+----------------- +---------------- +---------------- 十 
| Eskimo Curlew | 66.16051056 | 66.16051056 | 
| Whimbrel | 30.29138551 | 30.29138551 | 
| Eurasian Curlew | 51.70469364 | 42.69096856 | 
+----------------- +---------------- +---------------- 十 


此 结果 和 集中， 因为 前 两 种 鸟 只 被 发 现 过 一 次 ， 所 以 最 南 和 最 北 都 是 同一 个 地 点 ， 而 
Eurasian Curlew 则 很 明显 是 在 不 同 地 方 都 被 见 到 过 。 


12.1.3 ”拼接 同 组 的 值 


在 结束 聚合 函数 这 个 话题 之 前 ， 我 还 想 介绍 一 个 函数 ， 那 就 是 GROUP_CONCAT()。 它 并 不 党 
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用 ,但 在 某 些 特殊 情况 下 ， 它 会 特别 有 用 。 它 可 以 把 一 个 组 所 有 的 值 拼接 成 一 个 以 逗号 分 
隔 的 串 。 如 果 没 有 它 的 话 ， 你 就 需要 写 子 查询 ， 并 在 其 中 使 用 CONCAT_NS() 来 做 拼接 。 


举 个 例子 ， 若 要 列 出 某 个 鸟 目 中 的 所 有 岛 科 ， 很 简单 ， 一 个 SELECT 就 可 以 做 到 。 但 若是 
想 同时 列 出 目 和 科 ， 并 要 求 结果 集中 ， 同 属 一 目的 所 有 科 都 在 一 行 中 呢 ? 如 果 没 有 GROUP_ 
CONCAT()， 会 很 床 烦 。 下 面 就 来 看 看 它 能 产生 怎样 的 效果 。 输 入 以 下 语句 : 


SELECT bird_orders.scientific name AS 'Bird Order', 
GROUP_CONCAT(bird_families.scientific_name) 

AS 'Bird Families in Order' 

FROM rookery.bird_families 

JOIN rookery.bird_orders USING(order_id) 

WHERE bird_orders.scientific name = 'Charadriiformes' 
GROUP BY order_id \G 























类 炎炎 淡淡 火炎 火炎 类 炎炎 淡淡 火 火 火炎 大 大 大 大 大火 火 火 火 4 row 类 淡淡 火 火 火炎 大 大 炎炎 淡淡 火炎 火炎 类 类 类 火 汪 淡淡 火炎 类 


Bird Order: Charadriiformes 
Bird Families in Order: 


Charadriidae,Laridae,Sternidae,Burhinidae,Chionidae,Pluvianellidae, 
Dromadidae,Haematopodidae,Ibidorhynchidae,Recurvirostridae, 
Jacanidae,Scolopacidae,Turnicidae,Glareolidae,Pedionomidae, 
Thinocoridae,Rostratulidae,Stercorariidae,Alcidae 


为 了 节省 空间 ， 我 只 查 了 一 个 目 。 如 果 想 查 所 有 目 ， 只 需 去 掉 WHERE: 


SELECT bird_orders.scientific name AS "Bird Order ' ， 
GROUP_CONCAT(bird_families.scientific name SEPARATOR ', ') 
AS 'Bird Families in Order' 

FROM rookery.bird_ families 

JOIN rookery.bird orders USING(order_id) 

GROUP BY order_id \G 


试 试 上 面 的 语句 ， 你 会 发 现 ，GROUP_CONCAT() 中 的 SEPARATOR 子 句 使 每 个 科 名 之 间 都 以 逗 
号 和 空格 分 隔 开 来 了 。 


12.2 ”数值 函数 

能 以 某 种 方式 改变 数字 的 函数 叫 作 数值 函数 。 它 们 本 身 是 不 做 计算 的 。 如 果 做 的 话 ， 那 就 
叫 算术 函数 了 。 它 们 能 帮 你 简化 结果 集中 的 数字 ， 例 如 四 舍 五 入 或 者 求 绝 对 值 。 这 些 用 数 
值 函 数 轻 易 就 能 完成 。 本 市 讲 的 就 是 这 些 函 数 。 


12.2.1 ”四舍五入 

计算 机 很 精确 ， 所 以 有 时 它们 的 计算 结果 会 带 有 很 多 位 小 数 。 这 对 你 来 说 可 能 不 算 什么 问 
题 ， 尤 其 是 在 你 把 数字 只 作为 其 他 函数 的 参数 ， 而 不 是 要 展示 出 来 时 。 但 一 般 来 说 ， 人 们 
总 是 比较 习惯 于 经 过 舍 入 的 数字 ， 而 不 需要 像 计 算 机 那样 精确 。 对 于 这 种 情况 ， 可 以 使 用 
一 些 数值 函数 来 进行 四 舍 五 入 。 

在 5.2 节 中 ， 我 们 在 MariaDB 中 建 了 一 些 含 有 动态 列 的 表 ， 用 来 保存 与 用 户 观 鸟 偏好 
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相关 的 调研 信息 。 现 在 就 用 它们 来 测试 一 些 数值 函数 。 如 果 你 没 建 这 些 表 ， 或 者 没 用 
MariaDB ， 那 么 是 做 不 了 以 下 例子 的 。 


作为 开始 ， 先 回顾 一 下 当时 写 过 的 一 条 SQL 语句 。 先 从 我 的 网 站 导入 更 多 数据 ， 然 后 再 运 
SELECT IFNULL(COLUMN_GET(choices, answer AS CHAR), 'total') 
AS 'Birding Site', COUNT(*) AS 'Votes' 
FROM survey_answers 
JOIN survey_questions USING(question_id) 
WHERE survey_id = 1 
AND question id = 1 
GROUP BY answer WITH ROLLUP; 














+--- +------- 十 
| Birding Site | Votes | 
+--- +------- 十 
| forest | 30 | 
| shore | 42 | 
| backyard | 14 | 
| total | 86 | 
+--- +------- 十 


这 个 结果 集 显 示 了 观 鸟 地 点 偏好 的 投票 情况 。 让 我 们 来 计算 百分比 。 首 先 ， 我 们 要 知道 总 
票数 。 这 可 以 用 子 查询 来 返回 ， 但 为 了 做 得 更 简单 ， 我 们 先 用 一 个 SELECT 查 出 它 ， 并 把 它 
临时 保存 在 一 个 用 户 自 定义 变量 之 中 。 用 户 自 定 义 变 量 是 临时 性 的 ， 它 只 存在 于 当前 用 户 
会 话 中 ， 也 只 能 由 其 创建 者 访问 。 创 建 这 样 一 个 用 户 自 定义 变量 需要 用 SET 语句 ， 然 后 
指定 一 个 以 开头 的 名 字 ， 再 用 = 连接 上 一 个 值 ， 或 者 一 个 表达 式 ， 又 或 者 一 条 返回 单个 
值 的 SQL 语句 。 现 在 就 来 给 我 们 的 例子 建 一 个 用 户 自 定 义 变量 。 在 你 的 MariaDB 中 ， 输 
入 以 下 语句 : 

SET @fav_site_total = 

(SELECT COUNT(*) 

FROM survey_answers 

JOIN survey_questions USING(question_id) 


WHERE survey_id = 1 
AND question id = 1); 
























































SELECT @fav_site_total; 


+----------------- + 
| @fav_site total | 
+----------------- + 
| 86 

+----------------- + 








因为 我 后 来 还 导 了 更 多 数据 到 survey_answers 表 ， 所 以 数值 比 之 前 的 高 了 。 在 下 一 个 例子 
中 ， 就 可 以 看 到 这 个 总 数 是 正确 的 。 现 在 用 这 个 变量 来 计算 每 个 选项 投票 的 百分比 ; 
SELECT COLUMN_GET(choices, answer AS CHAR) 
AS "Birding Site ' ， 
COUNT(*) AS 'Votes ' ， 

















(COUNT(*) / @fav_site_total) AS 'Percent' 
FROM survey_answers 

JOIN survey_questions USING(question_id) 
WHERE survey_id = 1 

AND question id = 1 

GROUP BY answer; 











| 

[| 

| shore | 42 | 0.4884 | 

| backyard | 14 | 0.1628 | 
此 语句 用 每 种 选项 的 票数 除 以 总 票数 0 中 的 那个 )， 得 出 的 结果 有 四 位 小 数 。 
让 我 们 把 它 乘 以 100， 使 其 变 成 百分数 的 形式 ， 然 后 再 用 ROUND() 来 消除 小 数 部 分 。 最 后 ， 
再 用 CONCAT() 加 上 百 分 号 : 





SELECT COLUMN_GET(choices, answer AS CHAR) 
AS 'Birding Site', 

COUNT(*) AS 'Votes', 

CONCAT( ROUND( (COUNT(*) / @fav_site_total) * 100), '%') 
AS 'Percent' 

FROM survey_answers 

JOIN survey_questions USING(question_id) 

WHERE survey_id = 1 

AND question_id = 

GROUP BY answer; 


+--- +------- +--------- + 
| Birding Site | Votes | Percent | 
+--- +------- +--------- + 
| forest | 30 | 35% 

| shore | 42 | 49% | 
| backyard | 14 | 16% | 
+--- +------- +--------- + 


注意 ， 这 里 ROUND() 使 得 前 两 个 数 上 舍 入 ， 而 最 后 一 个 数 下 舍 和 信 。 这 是 因为 四 舍 五 入 就 是 
这 样 下 面 我 们 再 改 改 ， 让 它 保 留 一 位 小 数 : 


SELECT COLUMN_GET(choices, answer AS CHAR) 

AS 'Birding Site', 

COUNT(*) AS 'Votes', 

CONCAT( ROUND( (COUNT(*) / @fav_site_total) * 100, 1), '%') AS "Percent' 
FROM survey_answers 

JOIN survey_questions USING(question_id) 

WHERE survey_id = 

AND question_id = 

GROUP BY answer; 
































+---- +------- +--------- + 
| Birding Site | Votes | Percent | 
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+-------------- +------- +--------- 十 
| forest | 30 | 34.9% | 
| shore | 42 | 48.8% | 
| backyard | 14 | 16.3% | 
+--- +------- +--------- + 


在 保留 小 数 的 情况 下 ， 舍 入 依然 正确 。 假 设 我 们 保守 一 点 ， 希 望 无 论 如 何 都 上 舍 入 ， 又 或 
者 无 论 如 何 都 下 舍 入 ， 那 就 需要 别 的 函数 了 。 


12.2.2 上 舍 入 或 下 舍 入 


若 只 想 下 舍 入 ， 用 FLOOR()。 若 只 想 上 舍 入 ， 则 用 CEILING()。 现 在 再 拿 上 一 个 例子 ， 演 示 
下 舍 入 : 


SELECT COLUMN_GET(choices, answer AS CHAR) 
AS 'Birding Site', 

COUNT(*) AS 'Votes', 

CONCAT( FLOOR( (COUNT(*) / @fav_site_ total) * 100), '%') 
AS "Percent" 

FROM survey_answers 

JOIN survey_questions USING(question_id) 

WHERE survey_id = 1 

AND question_id = 

GROUP BY answer ; 




















+-------------- +------- +--------- + 
| Birding Site | Votes | Percent | 
+-------------- +------- +--------- 十 
| forest | 30 | 34% 

| shore | 42 | 48% 

| backyard | 14 | 16% | 
+-------------- +------- +--------- 十 


这 次 ， 我 们 把 ROUND() 换 成 了 FLOOR()， 使 其 无 论 如 何 都 下 舍 入 。 不 过 FLOOR() 不 能 指定 保 
留 多 少 位 小 数 ， 它 只 会 返回 整数 。 


如 果 想 上 伟人 ， 可 以 用 CEILING()， 如 下 所 示 : 


SELECT COLUMN_GET(choices, answer AS CHAR) 

AS 'Birding Site', 

COUNT(*) AS 'Votes', 

CONCAT( CEILING( (COUNT(*) / @fav_site total) * 100), '%') AS 'Percent' 
FROM survey_answers 

JOIN survey_questions USING(question_id) 

WHERE survey_id = 1 

AND question_id = 

GROUP BY answer; 











+--- +------- +--------- + 
| Birding Site | Votes | Percent | 
+--- +------- +--------- 十 
| forest | 30 | 35% 

| shore | 42 | 49% 

| backyard | 14 | 17% | 
+--- +------- +--------- + 





这 就 全 都 上 舍 入 了 。 如 采 参 数 不 含 小 数 ， 则 不 会 有 任何 改变 。 


12.2.3” 截 短 数字 














如 果 你 并 不 特别 想 要 上 舍 入 或 下 舍 入 ， 只 想 去 掉 小 数 ， 那 可 以 用 TRUNCATE()。 试 试 将 它 用 








寺 


刚才 的 例子 上 : 


SELECT COLUMN_GET(choices, answer AS CHAR) 
AS 'Birding Site', 

COUNT(*) AS 'Votes', 

CONCAT( TRUNCATE( (COUNT(*) / @fav_site_total) * 100, 1), '%') 
AS 'Percent' 

FROM survey_answers 

JOIN survey_questions USING(question_id) 

WHERE survey_id = 1 





AND question id = 1 

GROUP BY answer; 

+-------------- +------- +--------- 十 
| Birding Site | Votes | Percent | 
+-------------- +------- +--------- 十 
| forest | 30 | 34.8% | 
| shore | 42 | 48.8% | 
| backyard | 14 | 16.2% | 
+-------------- +------- +--------- 十 


顾名思义 ， 这 个 函数 就 是 把 指定 的 小 数位 (本 例 中 是 1) 之 后 的 小 数 给 截 掉 。 


12.2.4 消除 负数 

有 了 时候， 用 函数 处 理 数 字 时 ， 你 可 能 会 把 参数 顺序 搞 错 ， 导 致 结果 和 带 
知道 两 个 数字 之 间 差 多 少 ， 可 以 使 用 ABS() 来 求 绝 对 值 ， 使 结果 不 带 
值 在 某 些 数学 计算 中 很 重要 。 






































有 仙 号 
人 负 号 。 








。 如 果 你 只 想 
事实 上 ， 绝 对 





为 了 演示 该 函数 的 用 法 ， 我 会 用 到 前 面 “ 鸟 类 识别 ”的 一 些 例子 。 我 们 计算 每 个 用 户 测试 


时 间 的 总 和 ， 但 这 次 不 需要 按 human_id 来 分 组 : 


SELECT 

SUM( TIME_TO_SEC( TIMEDIFF(id_start, id_end) ) ) 
AS 'Total Seconds for ALL ' ， 

ABS( SUM( TIME_TO_SEC( TIMEDIFF(id_start, id_end) ) ) ) 
AS 'Absolute Total' 

FROM bird_identification_tests; 


+----------------------- +---------------- 十 
| Total Seconds for ALL | AbsoLute Total | 
+----------------------- +---------------- 十 
| 1689 | 1689 | 
+----------------------- +---------------- 十 





这 个 函数 和 例子 并 不 复杂 。 结 果 中 第 一 个 域 之 所 以 是 负数 ， 是 因为 在 TIMEDIFF() 中 ， 我 们 
将 id_start 放 在 id_end 前 面 了 。 当 然 你 可 以 把 它们 的 位 置 反 过 来 ， 以 计算 出 正 数 ， 但 有 
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些 时 候 ， 你 不 知道 两 个 参数 哪个 比较 大 。 这 时 ， 可 以 用 ABS() 来 解决 。 


如 果 想 知道 一 个 值 是 正 还 是 负 ， 可 用 SIGN()。 当 传 给 它 的 参数 为 正 时 ， 它 会 返回 1， 为 负 
时 ， 则 返回 -1， 参 数 为 0， 则 返回 0。 


我 们 再 用 鸟 类 识别 的 数据 来 演示 一 下 。 现 假设 我 们 想 知道 哪些 鸟 的 测试 所 用 时 间 比 平均 时 
间 少 。 因 为 最 少 平均 时 间 的 计算 已 在 12.1.2 节 中 做 过 ， 所 以 这 次 我 们 就 重用 其 中 部 分 语 
句 ， 并 且 将 计算 结果 保存 在 用 户 自 定 义 变量 中 ， 再 用 该 变量 与 bird_identification_tests 
表 的 每 一 行进 行 比 较 ， 这 样 就 可 以 只 查 出 测试 所 用 时 间 比 平均 时 间 少 的 行 。 下 面 ， 创 建 这 
个 变量 ， 然 后 在 服务 器 上 测试 它 
SET @min_avg_time = 
(SELECT MIN(avg_time) FROM 
(SELECT AVG( TIME_TO_SEC( TIMEDIFF(id_end, id_start))) 
AS 'avg_time' 
FROM bird_identification_tests 
GROUP BY human_id) AS average_times); 










































































SELECT @min_avg_time; 


+--------------- + 
| @min_avg_time | 
+--------------- + 
| 23.6667 | 
+--------------- + 


这 是 正确 的 。 之 前 我 们 算出 过 23 秒 ， 但 那 次 是 用 TIME_FORMAT() 四 舍 五 入 过 的 ， 而 这 次 是 
精确 值 。 接 着 ， 在 WHERE 中 ， 用 这 个 变量 配合 SIGN() 来 做 一 些 数 值 比较 。 输 入 以 下 语句 : 


SELECT CONCAT(name_first, SPACE(1), name_last) 
AS 'Birdwatcher', 
common_name AS 'Bird', 
ROUND(@min_avg_time - TIME_TO_SEC( TIMEDIFF(id_end, id_start) ) ) 
AS 'Seconds Less than Average' 
FROM bird_identification_tests 
JOIN humans USING(human_id) 
JOIN rookery.birds USING(bird_id) 
WHERE SIGN( TIME_TO_SEC( TIMEDIFF(id_end, id_start) - @min_avg_time)) = - 























+------------------- +---------------------- +--------------------------- 十 
| Birdwatcher | Bird Identified | Seconds Less than Average | 
+------------------- +---------------------- +--------------------------- 十 
| Lexi HoLLar | BLue Duck | 3 

| Lexi HoLLar | Trinidad Piping-Guan | 41301| 
| Geoffrey Dyer | Javan Plover | 15 | 
| Katerina Smirnova | Blue Duck | 2 

| Anahit Vanetsyan | Great Crested Grebe | 4 | 
+------------------- +---------------------- +--------------------------- 十 





这 样 ， 我 们 就 在 WHERE 中 用 SIGN() 筛选 出 了 测试 时 间 少 于 平均 时 间 的 会 员 。 这 个 函数 的 效 
果 很 难 用 其 他 方法 模拟 。 








12.3 小 结 


虽然 我 们 没有 把 所 有 聚合 函数 和 数值 函数 都 介绍 完 ， 但 已 经 把 大 部 分 都 讲 过 一 遍 ， 其 中 包 
含 了 最 常用 的 那些 。 被 省 略 的 主要 是 统计 分 析 函 数 以 及 算术 函数 ， 但 它们 是 很 易 懂 的 或 
专用 的 例如 ，POWER(2，8) 会 返回 2 的 8 次 方 ， 即 256; PI() 会 返回 工 ， 即 3.141593)。 
其 实 最 重要 的 是 ， 你 应 熟悉 聚合 函数 和 GROUP BY (因为 它们 很 常用 )， 并 且 掌 握 本 章 介 绍 
过 的 数值 函数 。 除 此 之 外 的 数值 函数 ， 你 可 能 在 茶 些 情况 下 也 会 用 到 。 如 果 想 了 解 这 些 
函数 ， 可 以 查看 MySQL 文档 (http://dev.mysql.com/doc/reftman/5.6/en/group-by-functions. 
html) 或 MariaDB 文档 (https://mariadb.com/kb/en/mariadb/functions-and-modifiers-for-use- 
with-group-by/) 。 


12.4 习题 


数值 函数 很 简单 ， 一 学 就 会 。 本 章 有 关 数 值 函 数 的 小 节 应 该 都 不 会 让 你 觉得 有 难度 。 而 聚 
合 国 数 就 可 能 有 点 麻烦 。 所 以 ， 下 面 有 些 习 题 要 求 你 使 用 数值 国 数 ， 而 大 部 分 都 包含 聚合 
国 数 的 练习 。 其 中 还 有 些 会 需要 你 将 两 者 组 合 起 来 使 用 。 这 些 习题 会 使 你 巩固 本 章 所 学 知 
识 。 本 章 的 习题 并 不 多 ， 你 应 该 能 很 快 完成 。 

(1) 写 一 个 简单 的 SELECT， 统计 birds 表 中 有 多 少 行 的 common_name 含有 Least。 执 行 它 并 
确保 能 正常 运行 。 接 着 ， 将 其 改 成 统计 birds 表 中 有 多 少 行 的 common_name 含有 Great。 
你 会 在 WHERE 中 用 到 LIKE。 

(0) 在 12.1.2 节 中 ， 我 们 谈 过 如 何 分 组 计数 。 用 GROUP BY 将 上 题 的 两 条 SQL 语句 合 二 为 
一 ， 使 得 结果 集中 有 一 个 域 显示 Least 鸟 的 数目 ， 另 一 个 域 显 示 Great 鸟 的 数目 。 

(3) 在 做 这 一 题 时 ， 你 可 能 需要 参考 12.1.1 节 中 统计 所 有 鸟 和 统计 每 科 鸟 的 例子 。 

写 一 个 查询 birds 表 的 SELECT， 结 果 集 返回 三 个 域 : 鸟 科 名 字 、 鸟 科 所 含 鸟 种 的 数 
量 ， 以 及 占 鸟 种 总 数 的 百分比 。 鸟 种 的 总 数 要 让 MySQL 算出 来 ， 不 要 自己 写 到 SQL 
语句 中 。 

执行 成 功 之 后 ， 用 一 个 数值 函数 来 修改 这 条 SQL 语句 ， 让 百分比 的 那个 域 保留 一 位 
小 数 。 

(4) 重 做 上 题 。 这 次 另 写 一 个 SELECT， 只 取得 鸟 种 总 数 。 用 SET 创建 一 个 用 户 自 定义 变量 ， 
来 保存 MySQL 通过 SELECT 取得 的 值 。 变 量 名 字 自 定 。 

现在 修改 上 题 中 的 SELECT， 使 用 该 变量 来 统计 百分比 。 执 行 成 功 后 ， 退 出 mysql 客户 端 

并 重新 登录 。 

再 把 创建 用 户 自 定义 变量 和 使 用 变量 来 统计 百分比 的 语句 执行 一 次 。 看 看 统计 百分比 的 
语句 伦 了 多 少时 间 。 然 后 再 执行 一 次 上 题 那个 不 用 变量 统计 的 语句 。 比 较 两 种 方法 的 运 
行 时 长 。 

(5) humans 表 中 有 个 membership_expiration 列 ， 里 面 含有 日 期 值 。 现 使 用 一 个 SELECT， 查 
询 每 个 会 员 的 membership_expiration 与 2014-01-01 之 间隔 了 多 少 个 月 。 如 果 你 不 清楚 
怎么 做 ， 可 参考 11.7 节 。 然 后 ， 在 WHERE 中 用 SIGN() 检查 会 员 资格 是 否 已 过 期 。 只 得 
选 出 未 过 期 的 用 户 。 做 法 可 参考 12.2.4 节 。 还 有 ， 记 得 在 HERE 中 用 IF NOT NULL 将 不 
用 付费 维持 会 员 资格 的 人 排除 掉 〈 即 那些 没有 过 期 日 的 ) 。 为 表示 间隔 了 多 少 个 月 的 那 
个 域 起 名 为 Months to Expiration。 
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(6) 修改 上 题 的 SQL 语句 ， 这 次 不 排除 资格 过 期 的 会 员 ， 只 排除 不 用 付费 维持 会 员 资格 的 
人 。 用 CONCAT() 给 会 员 资格 过 期 的 人 加 上 " - expired"。 你 需要 用 IF() 来 判断 哪些 人 
的 会 员 资 格 已 过 期 ， 并 用 ABs() 去 掉 负 号 。 

(7) 在 上 题 SQL 语句 的 基础 上 ， 写 一 条 新 的 SQL 语句 ， 计 算 需 要 付费 维持 会 员 资格 的 人 
“还 有 多 少 个 月 过 期 ”的 平均 值 ， 以 及 过 期 者 “过 期 了 多 少 个 月 ”的 平均 值 。 并 且 ， 将 
2014-01-01 当 作 当前 日 期 。 你 会 用 到 AvG() 来 计算 平均 值 。 运 行 成 功 后 ， 再 加 两 个 域 ， 
使 用 MIN()、MAX() 和 GROUP BY， 计 算出 最 少 和 最 多 的 月 数 。 
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第 五 部 分 


数据 库 管理 





最 后 这 个 部 分 将 探讨 MySQL 和 MariaDB 的 一 些 管 理 活动 。 它 们 不 一 定 与 数据 库 开发 
相关 ， 但 与 数据 管理 相关 。 其 中 有 些 活动 是 日 常 的 ， 有 些 是 偶尔 的 。 另 外 ， 我 们 还 会 讲 
MySQL 和 MariaDB 以 外 的 一 些 内 容 。 

首先 ， 第 13 章 会 讲 到 用 户 账号 和 权限 的 管理 。 我 们 在 本 书 开头 简单 介绍 过 这 一 话题 ， 而 
本 章 会 进行 更 深入 的 探讨 。 我 们 会 讲解 如 何 更 精确 地 指定 每 个 用 户 对 每 个 库 和 每 个 表 的 
权限 。 

第 14 章 将 讨论 如 何 备 份 数据 库 。 这 是 很 重要 的 管理 任务 。 除 此 之 外 ， 我 们 还 会 提 及 不 太 
常 做 的 恢复 备份 。 不 过 这 一 旦 做 起 来 ,通常 是 因为 数据 出 现 了 严重 、 紧 急 的 问题 。 我 一 如 
既往 地 建议 你 做 完 每 章 结尾 的 习题 。 而 因为 本 章 的 话题 如 此 重要 ， 所 以 相关 习题 尤其 不 容 
忽视 。 

第 15 章 讲 解 导 入 大 量 数据 的 管理 任务 。 你 可 能 不 会 经 常 从 其 他 数据 库 或 其 他 文件 (例如 
电子 表格 或 逗号 分 隔 值 文件 ) 导入 大 量 数据 。 但 了 解 导 入 过 程 是 非常 有 用 的 ， 可 以 让 你 在 
必要 时 节省 时 间 ， 减少 失败 的 概率 。 

本 书 最 后 一 章 ， 即 第 16 章 ， 将 简要 介绍 几 个 API， 里 面 含 有 使 用 PHP 和 其 他 编程 语言 连 
接 并 查询 MySQL 和 MariaDB 的 例子 。 几 乎 所 有 数据 库 都 需要 与 API 打交道 ， 因 为 使 用 
API 可 以 提高 数据 库 操作 的 灵活 性 和 安全 性 ， 也 使 用 户 无 需 直 接 面 对 数 据 库 。 



















































































191 


第 13 章 


用 户 账 号 和 权限 





在 本 章 之 前 ， 我 们 已 有 几 次 提 到 用 户 账号 和 权限 ， 而 本 章 将 详细 讨论 这 个 重要 的 话题 。 既 
然 安全 性 在 与 数据 相关 的 活动 中 如 此 重要 ， 可 能 有 人 会 觉得 应 该 在 本 书 的 开头 就 详细 地 讲 
解 这 个 话题 。 但 我 认为 ， 在 花 很 多 时 间 进 行 权 限 管 理 和 安全 管理 这 种 无 聊 的 任务 之 前 ， 先 
学 习 数 据 操作 会 更 有 趣 。 而 且 ， 在 深入 了 解 表 和 数据 库 中 的 其 他 组 件 之 后 ， 你 才 更 易 理 解 
用 户 权 限 的 重要 性 ， 以 及 思考 设置 权限 的 各 种 方法 。 所 以 ,现在 可 以 开始 考虑 用 户 账号 等 
相关 问题 ， 而 且 你 会 理解 为 何 我 把 这 些 内 容 放 在 这 里 ， 而 不 是 放 在 本 书 开头 。 

我 们 会 先 看 看 创建 用 户 帐号 和 授予 权限 的 基本 知识 ， 然 后 详细 讨论 如 何 限制 访问 ， 以 及 如 
何 给 不 同 的 数据 库 组 件 授予 不 同 的 权限 。 在 掌握 限制 访问 的 这 些 方法 后 ， 我 们 会 探讨 应 该 
给 一 些 常 见 的 管理 账号 授予 什么 权限 。 最 后 ， 我 们 将 学 习 如 何 回收 权限 、 删 除 账号 ， 以 及 
如 何 修 改 密码 和 重 命名 账号 。 


13.1 用 户 账号 的 基础 知识 

在 本 书 中 ， 我 多 次 用 了 用 户 账号 这 个 术语 ， 而 不 是 用 户 。 这 样 做 是 为 了 区 分 “用 户 名 与 主 

机 的 组 合 ” 和 “MySQL 或 MariaDB 的 使 用 者 ”这 两 个 不 同 的 概念 。 

举 个 例子 ， 你 可 以 让 root 用 户 在 所 有 数据 库 中 都 拥有 最 高 权限 ， 但 限制 它 只 能 通过 
造成 


localhost 登录 ， 而 不 允许 远程 登录 (例如 通过 互联 网 登录 )。 如 果 允 许 的 话 ， 可 能 会 造 
安全 问题 。 简 单 来 说 ,访问 和 权限 基于 用 户 和 主机 的 组 合 ， 这 个 组 合 也 叫 用 户 账号 。 


作为 root 用 户 ， 你 可 以 用 CREATE USER 语句 来 创建 用 户 账号 。 以 下 例子 使 用 此 语句 来 给 名 
为 Lena Stankoska 的 一 位 女性 创建 用 户 账号 : 


CREATE USER 'lena_stankoska'; 
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此 例 只 创建 了 用 户 账号 ， 而 没有 授予 它 任何 权限 。 如 
可 以 使 用 SHOW GRANTS 语句 ， 如 下 所 示 : 


SHOW GRANTS FOR 'lena_stankoska'; 





想 查看 一 个 用 户 账号 有 什么 权限 ， 


湘 
Gs 


4 + 
| Grants for lena_stankoska@% | 
4 + 
| GRANT USAGE ON *.* TO 'lena_stankoska'@'%' | 
4 + 


注意 ， 结 果 就 像 是 一 条 SQL 语句 。 除 了 使 用 CREATE USER 来 授权 ,也 可 以 使 用 如 上 的 
GRANT 语句 来 做 。 现 在 我 们 将 结果 拆 开 来 看 ， 但 是 从 右 往 左 看 。 


其 中 ， 用 户 名 是 Lena_stankoska， 主 机 是 通配符 %。 之 所 以 用 通配符 ， 是 因为 我 们 在 
CREATE USER 时 没有 指定 主机 。 于 是 ， 从 任何 主机 登录 这 个 账号 都 会 拥有 通用 的 权限 。 但 
这 样 是 不 好 的 。 无 论 何 时 你 都 应 该 指定 主机 。 作 为 一 个 初始 的 例子 ， 我 们 就 在 这 里 用 
localhost 吧 。 至 于 如 何 设 置 主 机 ， 我 们 会 在 下 一 节 再 讲 。 

结果 中 的 *.* 是 指 授权 使 用 所 有 数据 库 和 所 有 表 (句点 前 的 部 分 是 数据 库 ， 句 点 后 的 是 
表 )。 为 了 限制 用 户 只 能 操作 某 个 特定 的 数据 库 或 表 ， 应 把 *.* 改 成 database.table。 至 于 
如 何 写 ， 我 们 很 快 会 讲 到 。 

创建 完 用 户 账号 之 后 ， 一 般 你 就 会 给 它 授权 。 如 果 想 让 某 个 用 户 账号 从 localhost 登录 时 能 
使 用 所 有 SQL 语句 ， 可 以 使 用 如 下 GRANT 语句 : 


GRANT ALL ON rookery.* 
T0 'lena_stankoska'@'localhost'; 









































SHOW GRANTS FOR 'lena_stankoska'@'localhost'; 


| GRANT USAGE ON *.* TO 'lena_stankoska'@'localhost' | 
| GRANT ALL PRIVILEGES ON ‘rookery .* TO 'lena_stankoska'@'localhost' | 





注意 ， 现 在 用 户 账号 lena_stankoska@localhost 的 SHOW GRANTS 结果 变 成 两 行 了 : 第 一 行 
与 之 前 的 结果 相似 ， 而 第 二 行 是 我 们 刚刚 才 授 权 的 。 现 在 除了 给 别人 授权 ， 它 还 可 以 对 
rookery 数据 库 进行 各 种 操作 。 而 关于 授权 的 能 力 以 及 其 他 可 施加 的 权限 ， 我 们 会 在 本 章 
后 面谈 到 。 

因为 我 们 还 没 给 该 用 户 账号 指定 密码 ， 所 以 它 无 需 密码 便 可 登录 。 这 样 很 危险 ， 即 相当 于 
任何 人 不 输 密码 都 可 以 访问 该 服务 器 ， 并 能 对 数据 库 执行 几乎 所 有 的 命令 。 因 为 我 们 创建 
该 用 户 账号 只 是 为 了 演示 如 何 授 予 和 查看 权限 ， 所 以 先 删 掉 它 ， 之 后 再 重建 一 次 。 

删除 用 户 账号 的 语句 是 DROP USER。 但 在 删 Lena Stankoska 这 个 用 户 账号 之 前 ， 其 实 要 考 
虑 很 多 因素 。 当 执行 CREATE USER 而 没 指定 主机 时 ， 我 们 建 了 一 个 带 有 通配符 的 用 户 账号 。 
当 我 们 用 GRANT 来 给 同一 个 用 户 授权 时 (不 过 这 次 是 与 localhost 主机 的 组 合 ) ， 就 创建 了 
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另 一 个 用 户 账号 。 想 理解 得 更 深入 ， 来 看 看 mysql 数据 库 的 user 表 ， 那 里 保存 着 该 用 户 账 
号 的 信息 。 输入 以 下 语句 : 
SELECT User, Host 


FROM mysql.user 
WHERE User LIKE 'lena_stankoska'; 


| lena_stankoska | % | 
| lena_stankoska | localhost | 
+---------------- +----------- + 


如 你 所 见 ， 虽 然 我 们 只 想 创建 一 个 用 户 账号 ,但 结果 建 了 两 个 。 如 果 你 之 前 没 搞 懂 “用 
户 ” 和 “用 户 账号 ”的 区 别 ， 我 希望 你 能 从 这 里 看 出 来 。 


尽管 可 以 直接 在 mysql 数据 库 中 访问 用 户 账号 的 权限 ， 但 还 是 不 要 用 那 种 方 
法 来 修改 用 户 账号 。 虽 然 到 现在 示例 都 很 简单 ， 但 某 些 权限 管理 的 操作 其 实 
会 影响 到 mysql 数据 库 的 多 个 表 。 如 果 不 使 用 本 章 介绍 的 一 些 合适 的 用 户 账 
号 语句 ， 而 尝试 用 INSERT、UPDATE 或 DELETE 来 插入 、 更 新 或 删除 user 表 中 
的 用 户 账号 ， 那 就 可 能 会 达 不 到 想 要 的 效果 ， 并 在 其 他 表 中 产生 孤立 数据 。 



































要 删除 我 们 给 Lena Stankoska 创建 的 两 个 用 户 账号 ， 需 要 执行 两 次 DROP USER， 如 下 所 示 : 


DROP USER 'lena_stankoska'@'localhost'; 
DROP USER 'lena_stankoska'@'%'; 


这 就 把 两 个 用 户 账号 都 删 掉 了 。 在 接 下 来 的 几 节 中 ， 我 们 会 给 她 创建 更 多 的 用 户 账号 ， 但 
会 更 密切 地 关注 如 何 限制 用 户 账号 的 访问 权限 ， 以 使 她 不 能 在 未 填 密码 的 情况 下 就 登录 或 
随便 访问 各 种 资源 。 


13.2 ”限制 用 户 账号 的 访问 权限 


数据 库 管 理 员 可 以 授予 用 户 从 任何 地 方 访问 并 操作 所 有 资源 的 权限 ， 也 可 以 限制 用 户 只 能 
从 某 些 地 方 登录 ， 或 只 能 操作 某 些 资源 。 简 而 言 之 ， 可 以 限制 基于 用 户 名 和 主机 的 权限 ， 
用 户 账号 访问 的 数据 库 组 件 (如 表 )， 以 及 在 数据 库 组 件 上 会 用 到 的 SQL 语句 和 函数 。 本 


矶 将 介绍 这 些 限制 。 


13.2.1 用 户 名 和 主机 


创建 用 户 账号 的 时 候 ， 你 得 考虑 是 谁 需 要 登录 ， 以 及 从 哪里 登录 。 现 在 先 看 看 “ 谁 ” 的 定 
义 。“ 谁 ”可 以 是 一 个 人 ， 也 可 以 是 一 群 人 。 你 可 以 给 每 个 人 都 建 一 个 用 户 名 ， 例 如 根据 
实名 来 起 数据 库 用 户 名 ， 给 Lena Stankoska 建 一 个 lena_stankoska 用 户 名 。 你 也 可 以 给 一 
群 人 建 一 个 用 户 名 ， 例 如 给 销售 部 建 一 个 sales_dept 用 户 名 。 你 其 至 可 以 按 功能 或 用 途 来 
起 名 。 在 这 种 情况 下 ， 一 个 人 可 能 会 有 多 个 用 户 账号 。 
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假设 Lena Stankoska 是 rookery 和 birdwatchers 的 数据 库 管理 员 ， 那 么 她 就 可 能 拥有 多 个 
用 户 名 (假设 全 都 只 能 从 localhost 登录 )， 例 如 ，lena_stankoska 用 于 个 人 作业 ; admin_ 
backup 用 于 备份 数据 ，admin_restore 用 于 恢复 备份 。 而 如 果 她 平时 还 导入 大 批 数据 ， 那 么 
还 可 以 建 一 个 admin_import。 

现在 先 创 建 Lena Stankoska 的 个 人 作业 账号 ， 稍 后 再 创建 管理 员 账 号 。 个 人 账号 有 两 个 ， 
名 字 都 叫 lena_stankoska: 一 个 用 于 localhost 登录 ， 另 一 个 用 于 远程 登录 。 并 且 让 她 在 
localhost 登录 时 ， 权 限 大 些 ， 而 远程 登录 时 (在 家 里 登录 ,假设 她 家 有 个 固定 IP)， 权 限 
小 些 。 具 体 来 说 ， 账 号 命 六 lena_stankoska@localhost 和 lena_stankoska@lena_stankoska_ 
home。 


定义 账号 时 ， 主机 名 可 以 是 能 通 过 DNS 查找 到 的 名 字 ， 也 可 以 是 实际 的 全 地 址 。DNS 查 
找 可 以 通过 外 部 的 域名 服务 器 ， 也 可 以 是 内 部 的 bind 程序 和 hosts 文件 (如 Linux 的 /etc/ 
hosts 文件 )。 如 果 选 择 后 者 ， 则 需要 重启 MySQL 才能 采用 。 

下 面 就 是 实际 操作 。 输 入 以 下 语句 ， 给 Lena Stankoska 创建 两 个 用 于 个 人 作业 的 用 户 账号 : 


CREATE USER "Lena_stankoska'Q'LocaLhost' 
IDENTIFIED BY "her_password_123 ' ; 
































GRANT USAGE ON *.* TO 'lena_stankoska'@'lena_stankoska_home' 
IDENTIFIED BY 'her_password_123'; 


此 例 分 别 用 了 CREATE USER 和 GRANT 来 创建 用 户 账号 。 如 果 GRANT 所 指 的 用 户 名 不 存在 ， 
则 会 自动 创建 用 户 一 一 记 住 ， 用 户 名 与 主机 的 组 合 是 一 个 独特 的 用 户 账 号 。 不 过 ， 建 议 你 
还 是 先 使 用 CREATE USER， 后 使 用 GRANT。 另 外 ， 我 们 在 每 条 语句 中 都 加 了 IDENTIFIED BY 
子 句 ， 这 样 给 每 个 用 户 账号 都 设置 了 密码 。 

接着 ， 我 们 看 看 其 中 一 个 用 户 账号 的 样子 。 输 入 以 下 命令 


SHOW GRANTS FOR 'lena_stankoska'@'localhost' \G 








炎炎 炎炎 火炎 类 类 火炎 火炎 类 大火 火炎 类 炎 火炎 炎炎 大 类 类 大 于。 row 类 淡淡 火 火 火炎 大 类 类 淡淡 火 火 火 火炎 类 尖 炎炎 火炎 火炎 炎炎 


Grants for admin_backup@localhost: 
GRANT USAGE ON *.* TO 'lena_stankoska'@'localhost' 
IDENTIFIED BY PASSWORD ' *B1A8D5415ACESAB4BBAC120EC1D17766B8EFF1A1' 


注意 ， 显 示 出 来 的 密码 是 加 密 过 的 。MySQL 不 会 让 你 查看 到 原始 的 密码 串 ， 也 不 提供 解 
密 的 方法 。 而 且 ， 注 意 在 加 密 的 密码 前 ， 还 多 了 PASSWORD 关键 字 。 如 条 你 :不 想像 上 例 那 样 
明文 地 设置 密码 ， 可 以 在 另 一 台 计 算 机 上 ， 先 用 PASSWORD() 函数 进行 加 密 ， 然 后 用 GRANT 
把 加 密 的 结果 复制 到 服务 器 上 ， 如 下 所 示 : 


SELECT PASSWORD('her_password_123 ' ); 











4 + 
| PASSWORD('its_password_123') | 
4 + 
| *B1A8D5415ACE5AB4BBAC120EC1D17766B8EFF1A1 | 
4 + 

















结果 与 之 前 SHOW GRANTS 看 到 的 一 样 。 如 果 你 的 服务 器 在 记录 所 有 命令 ， 那 么 你 可 能 想 用 
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这 种 方法 在 自己 的 个 人 计算 机 上 给 密码 加 密 ， 以 防 别人 看 到 你 的 密码 明文 。 顺 便 说 一 下 ， 
从 MySQL 5.6 版 本 开始 ， 包 含 PASSWORD 的 语句 不 会 被 记录 。 


现在 ，Lena Stankoska 可 以 选择 某 个 用 户 账号 来 登录 了 ， 其 中 一 个 只 允许 她 从 家 里 登录 ， 
另外 四 个 只 允许 她 从 服务 器 登录 。 但 她 还 无 法 访问 任何 数据 库 ， 除 了 默认 的 两 个 ( 即 test 
和 ;information_schena)。 她 可 以 在 test 中 进行 各 种 各 样 的 操作 ， 包 括 建 表 ， 还 有 选择 、 
更 新 和 删除 数据 。 而 其 他 数据 库 对 于 她 来 说 则 不 可 访问 ， 甚 至 不 可 见 。 另 外 ， 她 也 无 法 创 
建 数据 库 。 使 用 这 些 用 户 账号 ， 是 很 受 约束 的 。 下 一 节 我 们 会 更 多 地 了 解 用 户 账号 可 以 访 
问 什么 资源 ， 并 试 试 让 Lena Stankoska 访问 test 以 外 的 数据 库 。 


13.2.2 ”SQL 权限 


除了 访问 数据 库 以 外 ，Lena Stankoska 还 需要 更 多 权限 才能 完成 她 的 工作 。 我 们 得 授予 她 
执行 各 种 任务 的 权限 ， 例 如 读 写 rookery 和 birdwatchers 数据 库 的 数据 。 现 在 ， 先 让 lena_ 
stankoska@localhost 在 这 两 个 数据 库 中 有 执行 SELECT、INSERT 和 UPDATE 的 权限 。 为 了 授予 
用 户 账号 多 种 权限 ， 我 们 要 将 这 些 权 限 以 逗号 分 隔 的 方式 ， 在 GRANT 中 列 出 : 


GRANT SELECT, INSERT, UPDATE ON rookery.* 
T0 'lena_stankoska'@'localhost'; 






































GRANT SELECT, INSERT, UPDATE ON birdwatchers.* 
T0 'lena_stankoska'@'localhost'; 


SHOW GRANTS FOR 'lena_stankoska'@localhost \G 


类 淡淡 火 火 淡淡 大业 类 淡淡 火 火 火 火炎 大 大 炎炎 火炎 火炎 火炎 pi row 类 淡淡 炎炎 淡淡 火炎 火炎 火炎 炎炎 炎炎 火炎 火炎 类 类 类 汪汪 火 


Grants for lena_stankoska@localhost: 
GRANT USAGE ON *.* 
TO 'lena_stankoska'@' localhost' 


类 淡淡 火 火 火炎 大 类 类 淡淡 火 火 火炎 类 太 大 类 类 汪汪 火炎 类 类 过 和 row 类 兴 兴 光 光 炎炎 类 类 火炎 火炎 炎炎 类 火炎 天 大火 类 大火 类 大 类 


Grants for lena_stankoska@localhost: 
GRANT SELECT, INSERT, UPDATE ON “birdwatchers .* 
TO 'lena_stankoska'@' localhost' 


类 淡淡 火 火 火炎 大 类 类 淡淡 火 火 火炎 火炎 大 类 类 炎炎 火 火炎 类 i row 类 淡淡 炎炎 淡淡 淡淡 火 火炎 炎炎 炎炎 火炎 炎炎 火炎 炎炎 类 业 火 


Grants for lena_stankoska@localhost: 
GRANT SELECT, INSERT, UPDATE ON ‘rookery .* 
TO 'lena_stankoska'@' localhost' 


有 些 权 限 的 授予 ， 会 同时 开放 多 种 SQL 语句 的 使 用 。 想 知道 到 底 有 多 少 种 权限 ， 可 参考 表 
13-1。 

虽然 lena_stankoska@localhost 已 有 足够 的 权限 在 这 两 个 数据 库 中 修改 数据 ， 但 还 不 能 删除 
数据 。 当 你 想 给 某 个 用 户 账号 增加 权限 时 ， 无 需 再 次 列 出 原 有 的 权限 ， 只 需 在 GRANT 中 写 
上 新 增 的 权限 即 可 。 如 下 : 


GRANT DELETE ON rookery.* 
T0 'lena_stankoska'@'localhost'; 











GRANT DELETE ON birdwatchers.* 





TO 'Lena_stankoska'Q'LocaLhost ' ; 


SHOW GRANTS FOR 'lena_stankoska'@localhost \G 


类 淡淡 淡淡 火炎 火炎 类 炎炎 淡淡 火 火 火炎 大 类 类 大火 火 火 火 类 二 row 炎 光 兴 火 火光 炎炎 炎炎 淡淡 大火 火 类 类 类 类 类 类 大 大 类 火炎 大 


Grants for lena_stankoska@localhost: 
GRANT USAGE ON *.* 
TO 'lena_stankoska'@' localhost' 


类 淡淡 淡淡 火炎 火炎 类 炎炎 淡淡 火 火炎 类 大 类 类 大火 火 火 火炎 + row 类 淡淡 火 火 火炎 大 大 尖 淡淡 火 火炎 火炎 类 类 类 火 汪 淡淡 火炎 类 


Grants for lena_stankoska@localhost: 
GRANT SELECT, INSERT, UPDATE, DELETE ON “birdwatchers .* 
TO 'lena_stankoska'@' localhost' 


类 淡淡 淡淡 火炎 火炎 类 类 淡淡 火 火 火 火炎 大 类 类 大 大火 火 火 类 与 row 类 淡淡 火 火 火炎 大大 类 淡淡 火 火炎 火炎 类 大 炎炎 淡淡 火 火炎 类 


Grants for lena_stankoska@localhost: 
GRANT SELECT, INSERT, UPDATE, DELETE ON ‘rookery .* 
TO 'lena_stankoska'@' localhost' 


这 样 ，Lena Stankoska 就 可 以 在 两 个 数据 库 里 进行 增删 改 查 了 ， 不 过 这 仅 限 于 从 localhost 
登录 。 而 从 家 里 登录 的 话 ， 她 还 是 什么 都 做 不 了 。 我 们 会 在 后 面 再 对 lena_stankoska@ 
lena_stankoska_home 进行 授权 。 


表 13-1: GRANT 和 REVOKE 语 句 中 可 用 的 权限 


































































































































































































权 限 描 述 

ALL [PRIVILEGES] 授予 所 有 基本 的 权限 ， 但 不 包括 GRANT OPTION 

ALTER 允许 使 用 ALTER TABLE 语句 ， 但 得 先 有 CREATE 和 INSERT 权限 。 如 果 想 重 命 名 一 
个 表 ， 还 得 先 有 DROP 权限 。 这 里 有 一 个 安全 隐患 : 用 户 可 以 通过 对 表 改 名 来 获 
得 访问 权 

ALTER ROUTINE 允许 用 户 账号 更 改 或 删除 存储 过 程 ， 即 允许 使 用 ALTER FUNCTION、ALTER 
PROCEDURE、DROP FUNCTION 和 DROP PROCEDURE 语句 

CREATE 允许 使 用 CREATE TABLE 语句 。 如 果 想 定义 索引 ， 还 需要 INDEX 权限 

CREATE ROUTINE 允许 用 户 账号 创建 存储 过 程 ， 即 允许 使 用 CREATE FUNCTION 和 CREATE PROCEDURE 
语句 。 并 且 ， 用 户 账号 对 自己 创建 的 过 程 拥有 ALTER ROUTINE 权限 

CREATE TEMPORARY TABLES 人 允许 使 用 CREATE TEMPORARY TABLES 语句 

CREATE USER 允许 用 户 账号 执行 以 下 用 户 账号 管理 语句 : CREATE USER、RENAME USER、REVOKE 
ALL PRIVILEGES 和 DROP USER 

CREATE VIEW 允许 使 用 CREATE VIEW 语句 

DELETE 允许 使 用 DELETE 语句 

DROP 允许 使 用 DROP TABLE 和 TRUNCATE 语句 

EVENT 允许 用 户 账号 为 事件 调度 器 创建 事件 ， 即 允许 使 用 CREATE EVENT、ALTER EVENT 
和 DROP EVENT 语句 

EXECUTE 允许 执行 存储 过 程 ， 即 允许 使 用 EXECUTE 语句 

FILE 允许 使 用 SELECT.. .INTO OUTFILE 和 LOAD DATA INFILE 语句 来 导出 数据 到 文件 系 
统 ， 或 从 文件 系统 导入 数据 。 这 有 一 个 安全 隐患 。 可 通过 secure_file_priv 变 
量 来 限制 指定 目录 
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权 限 描 述 
INDEX 人 允许 使 用 CREATE INDEX 和 DROP INDEX 语句 
INSERT 允许 使 用 INSERT 语 句 。 这 是 执行 ANALYZE TABLE、OPTIMIZE TABLE 和 REPAIR 





TABLE 语句 的 前 提 条 件 
允许 使 用 LoCK TABLES 语句 ， 但 用 户 必 须 先 对 表 有 SELECT 权限 
允许 使 用 SHOW PROCESSLIST 和 SHOW ENGINE 语句 

RELOAD 允许 使 用 FLUSH 语句 
友 
Ss 





LOCK TABLES 
PROCESS 

















REPLICATION CLIENT 忆 许 用 户 查 询 主 从 服务 器 的 状态 信息 ， 即 允许 使 用 SHOW MASTER STATUS、SHOW 


LAVE STATUS 和 SHOW BINARY L0GS 语句 



















































































REPLICATION SLAVE 进行 从 服务 器 复制 时 ， 需 要 此 权限 ， 它 将 允许 读 取 主 服务 器 的 二 进 制 日 志 事 件 

SELECT 人 允许 使 用 SELECT 语句 

SHOW DATABASES 允许 使 用 SHOW DATABASES 语句 来 查看 所 有 数据 库 ， 包 括 那些 没有 权限 的 数据 库 

SHOW VIEW 人 允许 使 用 SHOW CREATE VIEW 语句 

SHUTDOWN 允许 使 用 mysqladmiin 工具 的 shutdown 选项 

SUPER 人 允许 使 用 CHANGE MASTER TO、KILL、PURGE BINARY LOGS、SET GLOBAL 语句 ， 以 及 
mysqladmin 工具 的 debug 选项 

TRIGGER 允许 用 户 账号 创建 或 删除 触发 器 ， 即 允许 使 用 CREATE TRIGGER 和 DROP TRIGGER 
语句 

UPDATE 人 允许 使 用 UPDATE 语句 

USAGE 可 用 于 创建 无 权限 的 用 户 ， 或 在 不 影响 用 户 现 有 权限 的 情况 下 修改 其 某 方面 的 
属性 








13.2.3 ”数据 库 组 件 和 权限 

现在 我 们 来 看 看 用 户 账号 可 以 访问 数据 库 的 哪些 部 分 。 你 可 以 允许 用 户 账号 访问 服务 器 上 
所 有 的 数据 库 ， 也 可 以 让 它 只 能 访问 特定 的 数据 库 ， 特 定 的 表 ， 甚 至 特定 的 列 。 下 面 我 们 
先 看 看 如 何 指定 用 户 账号 可 以 访问 的 数据 库 ， 之 后 再 看 如 何 指定 表 和 列 。 


Lena Stankoska 在 家 登录 时 所 受 的 限制 比 从 localhost 登录 时 要 多 。 当 然 ， 如 
果 她 真 的 想 在 从 家 里 登录 时 能 访问 更 多 信息 ， 可 以 先 用 ssh 登录 操作 系统 ， 
然后 再 以 lena_stankoska@localhost 的 方式 登录 MySQL。 这 样 也 不 错 。 给 
lena_stankoska@lena_stankoska_home 加 上 这 些 限 制 ， 可 以 保证 敏感 数据 不 会 
未 经 加 密 就 泄露 出 去 。 而 在 操作 系统 的 级 别 上 ， 可 以 控制 得 更 多 ， 例 如 限制 
使 用 ssh 连接 ， 以 提高 安全 性 。 
































1. 限制 访问 特定 的 数据 库 
为 了 限制 lena_stankoska@lena_stankoska_home 只 能 在 rookery 上 操作 ， 可 以 采用 如 下 
方式 : 


GRANT USAGE ON rookery .* 
T0 'Lena_stankoska'Q'Lena_stankoska_home' 





IDENTIFIED BY "her_passwo 


SHOW GRANTS FOR "Lena_sta 


类 火炎 淡 火 六 淡 火 火炎 火炎 类 火炎 火炎 火炎 火炎 火 火 火炎 
Grants for lena_stankoska 
GRANT USAGE ON *.* TO 
IDENTIFIED BY PASSWOR 


rd_123 ' ; 
nkoska'@'lena_stankoska_home' \G 


火光 1 row 类 淡淡 淡 火 炎炎 火 尖 淡 火 火炎 火炎 淡淡 火 类 火炎 火炎 类 火炎 类 
@lena_stankoska_home: 

'lena_stankoska'@' lena_stankoska_home' 
D '*B1A8D5415ACESAB4BBAC120EC1D17766B8EFF1A1' 


我 们 给 该 用 户 账号 授予 了 对 rookery 的 USAGE 权限 。 但 是 ，SHOW GRANTS 的 结果 没有 改变 ， 
Lena Stankoska 依然 对 所 有 的 数据 库 和 表 都 有 USAGE 权限 。 如 果 她 从 家 里 登录 ， 并 使 用 列 


出 数据 库 的 命令 ， 会 看 到 以 下 结果 : 


mysql --user Lena_stankos 
--host rookery.eu - 


+-------------------- 十 
| Database 
+-------------------- 十 
| information_schema | 
| test 
+-------------------- 十 




















ka --password='her_password_123' \ 
-execute="'SHOW DATABASES ' 


她 依然 看 不 到 rookery 数据 库 。 这 是 因为 她 在 该 数据 库 中 什么 都 不 能 做 ， 甚 至 不 能 执行 
SHOW TABLES 或 SELECT。 要 让 她 看 到 rookery， 需 要 给 她 更 多 的 权限 ， 而 不 只 是 USAGE。 我 
们 先 给 她 在 rookery 中 执行 SELECT 的 权限 : 





GRANT SELECT ON rookery .* 
T0 'lena_stankoska'@'lena 


SHOW GRANTS FOR "Lena_sta 


| GRANT USAGE ON *.* TO ， 
| IDENTIFIED BY PASSWORD 
| GRANT SELECT ON ‘rooker 





因为 在 GRANT 中 不 能 只 给 
所 有 表 。 


EE 














_Sstankoska_home ' ; 


nkoska'Q'Lena_stankoska_home ' ; 


本 
ka@lena_stankoska_home | 
a te EC 宇 
lena_stankoska'@' lena_stankoska_home' 

a | 
y .* TO 'lena_stankoska'@'lena_stankoska_home' | 
A a + 





数据 库 名 ， 还 得 写 上 表 名 ， 所 以 这 里 用 了 .* 来 代表 rookery 的 





注意 ， 在 这 次 结果 中 ， 用 户 账号 对 所 有 库 和 表 的 USAGE 权限 依然 存在 。 而 该 条 目的 下 一 条 ， 
便 是 关于 rookery 的 权限 。 另 外 ， 为 了 适应 书页 的 大 小 ， 我 把 密码 部 分 换 成 了 省 略 号 。 现 


在 ，Lena Stankoska 可 以 从 家 是 
录 并 执行 SHOW DATABASES 和 SE 





mysql --user lena_stankos 





有 登录 ， 并 在 rookery 中 执行 SELECT 了 。 以 下 是 她 从 家 里 登 
LECT 查询 Avocet 鸟 的 结果 : 


ka --password='her_password_123' --host rookery.eu \ 





--execute="SHOW DATABASES; \ 
SELECT common_name AS 'Avocets' 
FROM rookery.birds \ 
WHERE common_name LIKE '%Avocet%';" 
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| Database 
+-------------------- + 
| information_schema | 

| rookery 

| test 
+-------------------- + 
+--------------------- 十 
| Avocets 
+--------------------- + 


| Pied Avocet | 
| Red-necked Avocet | 
| Andean Avocet | 
| American Avocet | 
| Mountain Avocetbill | 


2. 限制 访问 特定 的 表 

至 此 ，Lena Stankoska 可 以 从 办 公 室 操作 rookery 和 birdwatchers 这 两 个 数据 库 。 然 而 ， 
虽然 她 在 家 里 能 对 rookery 进行 SELECT 操作 ， 但 不 能 访问 birdwatchers。 现 在 ， 我 们 准许 
她 在 家 里 对 birdwatchers 中 的 某 些 表 进 行 SELECT 操作 。 


如 果 我 们 只 打算 开放 bird_sightings 的 SELECT 权限 ， 那 么 可 以 采用 如 下 方式 : 


GRANT SELECT ON birdwatchers.bird_sightings 
T0 "Lena_stankoska'Q'Lena_stankoska_home ' ; 




















SHOW GRANTS FOR "Lena_stankoska'Q'Lena_stankoska_home ' ; 


| GRANT USAGE ON *.* TO 'lena_stankoska'@'lena_stankoska_home' 

| IDENTIFIED BY PASSWORD '...' 

| GRANT SELECT ON ‘rookery'.* TO 'lena_stankoska'@'lena_stankoska_home’ 
| GRANT SELECT ON “birdwatchers' .bird_sightings. 

| TO 'lena_stankoska'@'lena_stankoska_home' 


这 样 ，bird_sightings 就 成 为 了 Lena Stankoska 唯一 能 在 birdwatchers 中 看 到 的 表 。 如 果 
她 从 家 里 的 计算 机 输入 以 下 命令 ， 便 会 看 到 如 下 结果 : 


mysqL --user Lena_stankoska --password='her_password_123' --host rookery.eu \ 
--execute="SHOW TABLES FROM birdwatchers;" 














+------------------------ + 
| Tables_in_birdwatchers | 
+------------------------ + 
| bird_sightings 

+------------------------ 十 





要 想 让 她 访问 birdwatchers 的 其 他 表 ， 可 以 针对 每 个 表 执 行 GRANT 语句 。 如 果 一 个 数据 
库 有 很 多 表 ， 这 样 做 就 很 麻烦 。 但 这 确实 无 可 避免 。 不 过 ， 在 写 这 一 章 时 ， 我 已 经 提 了 要 
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求 ， 让 MariaDB 可 以 一 次 针对 多 个 表 进 行 GRANT 操作 。 所 以 ， 说 不 定 未 来 在 MariaDB 中 
执行 GRANT 时 ， 你 可 以 轻松 一 点 。 暂 时 来 说 ， 你 只 能 手动 逐个 写 GRANT， 或 创建 一 个 简短 
的 脚本 来 帮 你 操作 。 


举 个 例子 ， 假 设 我 们 现在 想 批准 Lena Stankoska 操作 birdwatchers 中 所 有 的 表 (除了 那 
些 包含 个 人 数据 和 敏感 数据 的 表 )。 也 就 是 说 ， 批 准 她 操作 humans、birder_families 和 
birding_events_children 以 外 的 表 。 可 以 写 一 个 如 下 的 shell 脚本 


#!/bin/sh 








mysql_connect="mysql --user root -pmy_pwd" 


results=` $mysql_connect --skip-column-names \ 
--execute 'SHOW TABLES FROM birdwatchers;'. 


items=$(echo $results | tr " " "\n") 


for item in $items 


do 
if [ $item = 'humans' ] || 
[ $item = 'birder families' ] || 
[ $item = 'birding events_children' ] 
then 
continue 
fi 


‘$mysql_connect --execute "GRANT SELECT ON birdwatchers.$item \ 
TO 'lena_stankoska'@'lena_stankoska_home'". 
done 


exit 


这 个 简单 的 shell 脚本 用 SHow TABLES 取得 一 堆 表 名 ， 然 后 对 这 堆 中 的 每 个 表 名 逐个 执行 
GRANT 语句 (但 略 过 了 上 述 三 个 包含 敏感 信息 的 表 )。 


这 样 ，Lena Stankoska 便 可 以 在 办 公 室 处 理工 作 ， 并 在 家 里 检查 数据 。 除 此 之 外 ， 她 还 
可 以 做 一 些 管理 任务 ， 例 如 备份 数据 或 导入 大 量 数据 。 做 这 些 任务 时 ， 她 会 用 到 我 们 给 
她 创建 的 那 三 个 管理 员 账号 中 的 一 个 。 我 们 会 在 后 面 设置 这 三 个 账号 的 权限 ， 这 样 Lena 
Stankoska 就 可 以 完成 她 需要 做 的 任务 。 

3. 限制 访问 特定 的 列 

要 想 限制 用 户 账号 只 能 访问 某 些 列 ， 需 要 在 GRANT 的 权限 关键 字 后 ， 把 允许 访问 的 列 以 去 
号 分 隔 的 方式 列 于 括号 之 中 。 你 看 一 个 具体 的 例子 就 肯定 能 明白 。 如 果 同 时 还 授予 很 多 种 
权限 ， 那 这 个 GRANT 看 起 来 应 该 会 超级 长 。 


在 上 一 节 中 ， 出 于 安全 考虑 ， 我 们 没 给 Lena Stankoska 从 家 里 访问 humans 表 的 权限 。 假 
设 我 们 改变 了 想法 : 除了 用 户 的 联系 方式 〈 例 如 电子 邮件 地 址 )， 其 他 的 都 可 以 让 她 访 
问 。 为 了 能 与 其 他 表 连 接 ， 她 需要 有 human_id 列 的 访问 权限 。 此 外 ，formal_title、name_ 
first、name_last 和 membership_type 都 应 该 开放 。 而 剩 下 的 列 ， 不 是 包含 敏感 信息 ， 就 
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是 对 她 的 工作 没 用 。 
使 用 如 下 GRANT 语句 : 


GRANT SELECT 


(human_id, formal_title, name_first, 


name_last, membership_type) 
ON birdwatchers.humans 


TO 'lena_sta 


nkoska'@' lena_stankoska_home'; 











这 样 ，Lena Stankoska 便 能 在 家 中 访问 humans 表 中 每 个 会 员 的 姓名 及 其 会 员 资 格 的 类 型 了 。 


13.3 ”管理 员 账 号 


之 前 我 说 过 ， 我 们 要 给 Lena Stankoska 创建 三 个 从 localhost 登录 的 管理 员 账 号 ， 让 她 作为 
数据 库 管理 员 在 执行 任务 时 使 用 。 这 三 个 账号 是 admin_backup、admin_restore 和 admin_ 
































import。 这 些 管理 员 账 号 很 常见 ， 你 可 能 需要 创建 和 使 用 它们 。 在 第 14 章 〈 讲 备份 与 恢复 








数据 ) 和 第 15 章 


( 讲 批量 导入 数据 ) 中 ， 我 们 就 会 在 示例 中 用 到 这 三 个 账号 。 本 市 就 来 








创建 它们 ， 再 加 





个 用 于 授权 的 账号 ， 并 看 看 需要 给 它们 分 配 什么 权限 。 


13.3.1 用 于 备份 的 用 户 账号 


用 户 账号 admin_backup 和 实用 程序 nysqLdump 一 起 使 用 ， 可 以 对 rookery 和 birdwatchers 











进行 备份 。 这 会 丰 








FE 第 14 章 介绍 。 该 账号 需要 的 权限 不 多 。 























。 最 起 码 ， 需 要 有 SELECT 的 权限 才能 读 取 这 两 个 数据 库 。 应 该 限制 管理 员 账 号 只 能 访问 


需要 备份 的 库 。 


























尤其 是 ， 管 理 员 账号 不 应 该 拥有 对 mysql 数据 库 的 SELECT 权限 ， 因 为 








该 数据 库 含有 登录 密码 。 





。 因为 备份 时 需要 锁 住 表 ， 所 以 需要 LOCK TABLES 权限 。 
。 如 果 数 据 库 含 有 视图 或 触发 器 (本 书 不 涉及 这 两 个 话题 )， 那 用 户 账号 还 分 别 需 要 SHOW 








VIEW 和 TRIGGE 








R 权限 。 








基于 以 上 考虑 ， 我 们 来 创建 admin_backup@localhost， 并 授予 它 在 rookery 和 birdwatchers 


上 进行 SELECT 和 


CREATE USER 


LOCK TABLES 的 权限 。 命 令 如 下 : 


'admin_backup'@' localhost' 


IDENTIFIED BY 'its_password_ 123'; 


GRANT SELECT 
ON rookery.* 
TO 'admin_ba 


GRANT SELECT 


， LOCK TABLES 
ckup'@' localhost'; 


， LOCK TABLES 


ON birdwatchers.* 


TO 'admin_ba 


ckup'@' localhost'; 


这 样 ，Lena Stankoska 就 可 以 用 admin_backup 来 备份 数据 库 了 。 而 要 恢复 备份 ， 则 用 
admin_restore。 下 面 我 们 就 来 给 它 设置 权限 。 
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13.3.2 ”用 于 恢复 备份 的 用 户 账号 


虽然 可 以 创建 一 个 既 做 备份 又 做 恢复 的 账号 ， 但 你 可 能 想 用 单独 的 两 个 账号 来 完成 这 些 任 
务 。 这 主要 是 因为 备份 工作 多 数 是 用 脚本 自动 执行 的 ， 而 恢复 数据 通常 是 人 工 操 作 的 ， 并 
会 改动 甚至 破坏 服务 器 上 的 数据 。 你 应 该 不 会 希望 能 修改 数据 的 账号 密码 暴露 在 脚本 文件 








之 中 。 对 于 本 章 的 例子 来 说 ， 我 们 给 admin_restore@localhost 以 下 权限 ， 用 于 恢复 数据 。 


。 将 数据 从 dump 文件 恢复 到 表 中 时 ， 用 户 账号 至 少 需要 INSERT 权限 。 
。 在 插入 数据 时 ， 还 需要 LOCK TABLES 权限 来 锁 住 表 。 

。 需要 CREATE 和 INDEX 权限 来 分 别 创建 表 和 索引 。 

。 因为 dump 文件 可 能 包含 设置 校对 集 的 语句 ， 所 以 需要 ALTER 权限 。 











。 基于 Lena Stankoska 用 来 恢复 表 的 方法 ， 她 可 能 还 想 将 数据 恢复 到 临时 表 。 这 样 的 话 ， 


则 需要 CREATE TEMPORARY TABLES 权限 。( 临 时 表 会 在 连接 关闭 时 被 删 掉 。) 
。 如 果 数 据 库 有 视图 或 触发 器 ， 则 需要 CREATE VIEW 和 TRIGGER 权限 。 




















对 于 我 们 的 数据 库 使 用 来 说 ， 除 了 CREATE VIEW 和 TRIGGER， 甚 他 的 权限 都 是 要 有 的 。 下 本 











就 创建 admin_restore @localhost， 并 授予 它 必 要 的 权限 : 


CREATE USER 'admin_restore'@'localhost'" 
IDENTIFIED BY 'different_pwd_456'; 


GRANT INSERT, LOCK TABLES, CREATE, 
CREATE TEMPORARY TABLES, INDEX, ALTER 
ON rookery.* 

TO 'admin_restore'@'localhost'; 


GRANT INSERT, LOCK TABLES, CREATE, 
CREATE TEMPORARY TABLES, INDEX, ALTER 
ON birdwatchers.* 

TO 'admin_restore'@'localhost'; 


如 此 一 来 ，Lena Stankoska 应 该 就 可 以 恢复 rookery 和 birdwatchers 中 的 任何 数据 了 。 


13.3.3 ”用 于 批量 导入 的 用 户 账号 





我 们 需要 给 Lena Stankoska 创建 的 最 后 一 个 管理 员 账号 是 admin_import。 她 会 使 用 该 账号 
将 数据 从 文本 文件 批量 导入 数据 库 。 第 15 章 将 展开 这 个 话题 。 这 种 数据 导入 方法 需要 使 











用 LOAD DATA INFILE 语句 ， 而 该 语句 仅 需要 FILE 权限 。 


FILE 权限 存在 安全 风险 ， 因 为 它 可 以 读 取 服 务 器 上 MYSQL 能 查看 的 任何 
文件 。 因 此 ， 只 向 用 于 导入 文件 的 用 户 账号 授予 该 权限 ， 这 一 点 尤为 重要 。 
而 且 ， 该 账号 的 密码 也 应 该 只 交 给 值得 信任 的 人 。 除 此 之 外 ， 还 可 以 通过 
secure_file_priv 变量 来 限制 只 能 读 取 某 个 目录 。 这 样 ， 文 件 系 统 的 风险 就 
降 到 最 低 了 。 甚 至 还 可 以 在 不 执行 导入 操作 时 回收 权限 ， 而 等 到 要 导入 时 再 
授予 。 





























FILE 权限 不 能 指定 用 于 某 个 库 或 某 个 组 件 ， 它 是 一 个 全 局 权限 。 一 旦 授予 admin_import@ 
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localhost 这 个 权限 ， 那 么 它 就 可 以 将 数据 导入 任何 数据 库 ， 并 从 任何 数据 库 中 导出 数据 ， 

















已 。 下 面 ， 我 们 来 创建 admin_import@localhost， 并 给 该 账号 授权 : 


CREATE USER ‘admin_import'@'localhost' 
IDENTIFIED BY 'another_pwd_789'; 











GRANT FILE ON *.* 
TO ‘admin_import'@'localhost'; 











其 中 包括 mysql 数据 库 。 所 以 ， 要 留心 这 种 权限 的 分 配 ， 并 且 绝 对 不 要 允许 远程 登录 使 用 


现在 ，Lena Stankoska 的 管理 员 账 号 都 创建 好 了 ， 并 也 分 配 好 必要 的 权限 (这些 权限 不 多 
不 少 )， 供 她 操作 数据 库 。 现 在 ， 我 们 再 来 创建 一 个 可 能 对 你 有 用 的 管理 员 账 号 。 








13.3.4 ”用 于 授权 的 用 户 账号 














你 可 能 还 需要 一 个 用 于 创建 其 他 用 户 的 用 户 账号 。 虽 然 可 以 直接 用 root 来 做 ,但 为 了 贯彻 
按 用 途 划 分 用 户 账号 的 思想 ， 还 是 应 该 创建 一 个 单独 的 用 户 账号 ， 专 门 维护 用 户 和 权限 。 








另外 ， 这 个 任务 应 该 交 给 我 们 不 希望 其 完全 控制 数据 库 系统 的 人 。 





若 要 创建 一 个 账号 ， 使 其 能 创建 并 授权 其 他 用 户 账号 ， 需 要 在 GRANT 中 加 上 GRANT 
OPTION 子 句 。 它 使 这 个 账号 能 把 自身 拥有 的 权限 授予 其 他 账号 一 一 精度 与 原 GRANT 语句 
一 样 。 如 果 原 GRANT 只 有 两 个 数据 库 ， 则 给 其 他 账号 授权 时 也 只 能 是 这 两 个 数据 库 。 举 
个 例子 ， 执 行 以 下 命令 ， 创 建 admin_granter@localhost 这 一 账号 ， 并 以 GRANT OPTION 的 
































方式 给 它 授权 : 


GRANT ALL PRIVILEGES ON rookery.* 
TO 'admin_granter'@'localhost' 
IDENTIFIED BY 'avocet 123"' 

WITH GRANT OPTION; 


GRANT ALL PRIVILEGES ON birdwatchers.* 
TO 'admin_granter'@'localhost'" 
IDENTIFIED BY 'avocet 123"' 

WITH GRANT OPTION; 


这 样 就 创建 了 admin_granter@localhost， 它 能 把 自己 在 rookery 和 birdwatchers 上 的 权限 











授予 别 的 用 户 账号 。 


不 过 ， 这 样 的 权限 对 于 管理 其 他 账号 的 工作 来 说 ， 仍 然 不 够 。 例 如 ， 要 是 你 希望 这 个 用 户 
账号 能 创建 和 删除 账号 ， 还 得 授予 它 CREATE USER 权限 。 这 样 它 可 以 执行 SHOW GRANTS， 还 
需要 mysql 数据 库 上 的 SELECT 权限 。 这 又 存在 安全 风险 ， 要 留意 得 到 这 个 特权 的 用 户 账 











号 。 要 授予 用 户 账号 这 两 个 附加 的 特权 ， 输 入 以 下 两 条 语句 : 


GRANT CREATE USER ON *.* 
TO ‘admin_granter'@'localhost'; 


GRANT SELECT ON mysql.* 
TO ‘admin_granter'@'localhost'; 

















现在 ，admin_granter@1localhost 可 以 进行 用 户 账号 管理 的 工作 了 。 下 玫 


i 来 测试 一 下 ， 先 
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在 命令 行 输入 下 面 的 第 一 条 命令 ， 登 录 MySQL， 然 后 在 mysql 客户 端 中 输入 剩 下 的 SQL 
语句 : 


mysql --user admin_granter --password=avocet_123 








SELECT CURRENT_USER() AS 'User Account ' ; 


+------------------------- 十 
| User Account | 
+------------------------- 十 
| admin_granter@localhost | 
+------------------------- 十 


CREATE USER 'bird_tester'@'localhost'; 


GRANT SELECT ON birdwatchers .* 
TO 'bird_tester'@'localhost'; 


SHOW GRANTS FOR 'bird_tester'@'localhost'; 


| GRANT USAGE ON *.* TO 'bird_tester'@'localhost' 
| GRANT SELECT ON ‘birdwatchers’.* TO 'bird_ tester'@'localhost' | 


DROP USER 'bird_tester'@'localhost'; 


测试 成 功 。 整 个 过 程 如 下 : 首先 用 admin_granter@localhost 登录 ， 并 用 CURRENT_USER() 
确认 是 否 真 的 在 用 admin_granter@localhost; 然后 ， 创 建 一 个 新 账号 ， 并 授予 它 在 
birdwatchers 数据 库 上 的 SELECT 权限 ， 接着， 用 SHOW GRANTS 验证 是 否 授 权 成 功 ， 最 后 ， 
用 DROP USER 删 掉 该 账号 。 我 们 可 以 把 这 个 账号 交 给 某 个 负责 管理 数据 库 账 号 的 员工 。 


13.4 回收 权限 


从 本 章 开 头 到 现在 ， 我 们 一 直 都 在 给 用 户 账号 授予 权限 。 但 是 ， 有 时 候 你 可 能 想 回收 权 
限 ， 也 许 是 因为 错误 授权 ， 或 想 改变 用 户 账号 的 访问 权限 ， 抑 或 想 改变 所 要 保护 的 表 。 


REVOKE 可 用 于 回收 所 有 或 部 分 已 授予 某 个 用 户 账号 的 权限 。 它 有 两 种 写法 : 一 种 用 于 回收 
所 有 权限 ， 另 一 种 用 于 回收 指定 的 权限 。 下 面 就 来 看 看 这 两 种 写法 。 


假设 有 个 用 户 叫 Michael Stone， 他 要 请 几 个 月 的 假 ， 并 且 其 间 不 会 访问 我 们 的 数据 库 。 虽 
然 可 以 删 掉 这 个 账号 ， 但 我 们 还 是 决定 只 回收 权限 ， 然 后 在 他 回来 上 班 时 再 重新 授权 。 具 
体 来 说 ， 我 们 要 用 如 下 命令 : 

REVOKE ALL PRIVILEGES 


ON rookery.* 
FROM 'michael_stone'@'localhost'; 















































REVOKE ALL PRIVILEGES 
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ON birdwatchers.* 
FROM 'michael_stone'@'localhost'; 


这 种 写法 与 授予 所 有 权限 的 GRANT 相似 。 只 是 GRANT 带 ON 子 句 ， 而 REVOKE 带 FROM 子 句 ， 
以 表示 从 哪个 账号 回收 权限 。 尽 管 给 Michael Stone 授权 时 指定 了 某 些 表 ， 但 在 回收 时 不 需 
要 逐个 表 回 收 ， 只 需 如 上 所 写 ， 便 全 部 搞定 。 但 在 重新 授权 时 ， 还 是 要 逐个 表 来 写 GRANT。 


而 第 二 种 写法 用 于 只 回收 部 分 权限 。 这 些 权限 需要 用 逗号 分 隔 ， 并 写 在 REVOKE 后 面 。 权 限 
名 称 与 GRANT 所 用 的 一 样 ( 见 表 13-1)。 同 样 ， 可 以 逐个 表 写 REVOKE， 也 可 以 用 星 号 来 指 
代 所 有 表 。 如 果 是 回收 某 些 列 上 的 权限 ， 就 将 列 写 在 括号 中 ， 并 以 逗号 分 隔 ， 就 与 GRANT 
一 样 。 下 面 来 看 一 个 例子 。 

为 了 提高 安全 性 ， 我 们 打算 回收 一 些 不 必要 的 权限 。 之 前 我 们 为 admin_restore @localhost 
授予 了 ALTER 权限 ,但 现在 发 现 它 从 没 被 用 过 ， 所 以 ， 我 们 用 如 下 语句 回收 该 权限 。 


REVOKE ALTER 
ON rookery.* 
FROM 'admin_restore'Q'LocaLhost ' ; 
























































REVOKE ALTER 
ON birdwatchers.* 
FROM "admin_restore'Q'LocaLhost ' ; 


13.5 ”删除 用 户 账 号 


DROP USER 语句 可 用 于 删除 用 户 账号 。 现 在 来 看 看 它 的 用 法 。 假 设 Michael Stone 告诉 我 们 
他 找到 新 工作 了 ， 不 会 再 回来 。 那 么 我 们 可 以 用 以 下 语句 删除 他 的 账号 : 


DROP USER 'michael_stone'@'localhost'; 








如 果 MySQL 的 版 本 较 低 ( 低 于 5.0.2)， 则 需要 先 回 收 所 有 权限 ， 才 能 删除 
账号 。 先 执行 REVOKE ALL ON *.* FROM 'user'@'host'， 再 执行 DROP USER 


'user'@'host', 























有 些 用 户 可 能 拥有 多 个 私人 用 户 账号 ， 例 如 Lena Stankoska。 因 此 ， 在 删除 Michael Stone 
的 账号 时 ， 应 该 检查 他 是 否 还 有 其 他 账号 。 但 可 惜 的 是 ，MySQL 没有 SHOW USERS 语句 。 
所 以 ， 我 们 只 能 检查 mysql 数据 库 中 的 user 表 : 

SELECT User, Host 

FROM mysql.user 


WHERE User LIKE '%michael%' 
OR User LIKE '%stone%'; 











+--------------------- +------------- + 
| User | Host | 
+--------------------- +------------- + 
| mstone | mstone_home | 
| michael zabbalaoui | localhost | 
+--------------------- +------------- + 
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看 来 Michael Stone 还 有 男 一 个 与 他 家 IP 地址 关联 的 账号 。 于 是 ， 跟 他 确认 过 之 后 ， 我 们 
将 该 账号 删除 : 

DROP USER 'mstone'@'mstone_home'; 
在 删除 账号 时 ， 如 果 该 账号 已 登录 ， 并 且 有 活动 中 的 会 话 ， 那 么 这 些 会 话 都 不 会 被 停止 。 
它们 会 一 直 存 活 到 用 户 退 出 或 活动 停止 。 不 过 ， 也 可 以 即时 结束 会 话 。 首 先 ， 执 行 以 下 命 
令 ， 获 取 会 话 标识 : 


SHOW PROCESSLIST; 











类 火炎 淡 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 火 火 火炎 火 尖 4. row 类 淡淡 淡 火 炎炎 火炎 类 火 火炎 火炎 类 火炎 炎炎 火炎 火炎 类 类 类 
Id: 11482 
User: mstone 
Host: mstone_home 
db: NULL 
Command: Query 
Time: 78 
State: init 
Info: SELECT * FROM ‘birds. 
Progress: 0.000 


我 将 结果 简化 了 。 可 以 看 到 ， 虽 然 账号 已 被 删除 ， 但 mstone@mstone_home 仍 有 一 个 活动 
会 话 。 因 为 该 用 户 已 经 离职 ， 并 且 疫 打算 回来 ， 所 以 我 们 担心 他 会 从 家 里 捞取 数据 。 为 了 
解决 这 个 问题 ， 我 们 可 以 用 以 下 语句 结束 会 话 : 


KILL 11482; 





注意 ， 我 们 使 用 了 SHOW PROCESSLIST 结果 中 的 会 话 标识 。SHOW PROCESSLIST 和 KILL 分 别 需 
要 PROCESS 和 SUPER 权限 。 因 为 现在 这 个 会 话 和 Michael Stone 的 用 户 账号 都 已 被 删除 ， 所 
以 他 不 可 能 再 访问 我 们 的 数据 库 。 想 做 得 更 严 的 话 ， 我 们 甚至 可 以 在 操作 系统 层面 删除 他 
的 账号 ， 不 过 这 个 话题 已 超越 了 本 书 的 范围 。 


13.6 ”更改 密码 和 用 户 名 


如 果 想 使 数据 库 更 加 安全 ， 可 以 定期 更 改 用 户 账号 的 密码 (尤其 是 那些 拥有 管理 权限 的 账 
号 )。 下 一 小 节 将 讲解 如 何 更 改 密码 。 而 重 命名 账号 ， 尽 管 不 常见 ， 但 因为 它 可 能 会 导致 
一 些 安全 问题 ， 所 以 也 要 引起 注意 。 在 改名 或 改 密码 时 ， 应 检查 现存 的 脚本 中 是 否 用 到 它 
们 ， 特 别 是 要 看 看 那些 用 来 自动 备份 数据 库 的 脚本 。 如 果 是 ， 那 么 脚本 也 需要 修改 。 


13.6.1 给 用 户 账号 设置 密码 


我 们 在 本 章 创 建 用 户 账号 时 ， 有 些 带 有 密码 ， 有 些 则 没有 。 有 了 时， 你 可 能 需要 改 密码 (为 
了 安全 ， 确 实 应 该 定期 改 密码 )， 可 以 用 SET PASSWORD 语句 以 及 PASSWORD() 函数 (把 密码 
加 密 )。 
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在 MySQL 5.6 版 本 中 ， 可 以 令 密码 失效 ， 以 强迫 用 户 修改 密码 。 有 具体 做 法 就 
是 在 ALTER USER 中 使 用 PASSWORD EXPIRE 子 句 ， 如 下 : 

ALTER USER 'admin_granter'@'localhost' PASSWORD EXPIRE; 
这 样 ， 在 用 户 下 一 次 登录 或 执行 SQL 语句 时 ， 就 会 收 到 一 个 报错 信息 ， 告 
知 需要 改 密码 。 用 户 必须 改 密码 (使 用 SET PASSWORD)， 不 然 无 法 执行 任何 
SQL 语句 。 




















下 





在 我们 来 修改 admin_granter@localhost 的 密码 : 
SET PASSWORD FOR 'admin_granter'@'localhost' = PASSWORD('some_pwd_123 ' ) ; 
这 个 密码 太 简单 了 ， 我 们 来 改 个 复杂 的 密码 ， 比 如 Pled_Avoce7-79873。 若 想 更 安全 ， 


可 以 在 个 人 计算 机 上 加 密 ， 然 后 再 把 加 密 后 的 密码 填 到 服务 器 。 假 设 个 人 计算 机 上 有 
MySQL， 在 命令 行 执行 以 下 语句 : 


mysql -p --skip-column-names --silent \ 
--execute="SELECT PASSWORD('P1ied_Avoce7-79873')" 








*D47F09D44BA0456F55A2F14DBD22C04821BCC07B 


返回 的 结果 就 是 加 密 后 的 密码 。 只 需 复制 它 ， 然 后 登录 服务 器 ， 再 把 它 粘贴 到 改 密码 的 命 
令 中 
SET PASSWORD FOR 'admin_granter'@'localhost' = 
"xD47F09D44BA0456F55A2F14DBD22C04821BCCO7B ' ; 
密码 会 即时 更 新 。 你 可 以 自己 试 试 ， 看 是 否 能 用 Pled_Avoce7-79873 登录 。 


如 果 忘 了 root 密码， 有 一 个 简单 的 重 置 方法 。 首 先 ， 新 建 一 个 文本 文件 ， 输 
入 以 下 内 容 ， 注 意 一 行 写 一 条 语句 : 
UPDATE mysql.user SET Password=PASSWORD('new_pwd') WHERE User='root ' ; 
FLUSH PRIVILEGES; 
将 该 文件 起 名 为 rtresetsql， 并 放 在 受 保 护 的 目录 中 。 然 后 用 - -init-fite， 
启动 MySQL: 
mysqLd_safe --init-file=/root/rt-reset.sql & 
启动 后 ， 登 录 MySQL， 看 看 密码 是 否 已 经 修改 。 可 以 使 用 这 种 方式 多 次 修 
改 密码 。 改 完 之 后 ， 删 除 rt-reset.sql。 还 可 以 重启 MySQL， 但 因为 不 用 再 改 
了 ， 所 以 可 以 不 带 --init-file。 







































































13.6.2 用户 账号 重 命名 


RENAME USER 用 于 修改 用 户 名 。 可 以 用 它 来 改 用 户 账号 的 用 户 名 和 主机 。 只 有 有 具备 CREATE 
USER 权限 和 对 mysql 数据 库 UPDATE 权限 的 账号 ， 才 能 给 其 他 账号 改名 。 


为 了 看 看 RENAME USER 的 用 法 ， 我 们 就 来 试 试 把 lena_stankoska@lena_stankoska_home 改 成 
lena@stankoskahouse.com (假设 Lena Stankoska 是 该 域名 的 所 有 者 ， 并 会 从 该 域名 访问 我 
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们 的 数据 库 ) 。 输 入 以 下 命令 : 


RENAME USER 'lena_stankoska'@'lena_stankoska_home' 
TO 'lena'@'stankoskahouse.com'; 


一 旦 执行 以 上 命令 ， 与 lena_stankoska@lena_stankoska_home 关联 的 所 有 权限 都 会 移 到 
lena@stankoskahouse com。 下 面 来 检查 是 否 真 的 如 此 ， 


SHOW GRANTS FOR 'Lena'Q'stankoskahouse.com' ; 


| GRANT USAGE ON *.* TO 'lena'@'...' IDENTIFIED BY PASSWORD '"...' | 
| GRANT SELECT ON ‘rookery’.* TO "Lena'Q'...， | 
| GRANT SELECT ON “birdwatchers .eastern_birders_spottings ”TO 'lena'@'...' | 
| GRANT SELECT ON “birdwatchers ` .membership_prospects ”TO 'lena'@'...’ 

| GRANT SELECT ON “birdwatchers` .survey_answers`” TO 'Lena'Q'...' 

| GRANT SELECT ON “birdwatchers` .surveys ”TO 'lena'@'...’ 

| GRANT SELECT ON “birdwatchers` . survey_questions ”TO 'lena'@'...' 

| GRANT SELECT ON “birdwatchers ` .eastern_birders” TO 'lena'@'...' 

| GRANT SELECT ON “birdwatchers` . prospects`” TO 'Lena'@' ...，' 

| GRANT SELECT ON “birdwatchers ` .prize_winners” TO 'Lena'Q@'...' 

| GRANT SELECT ON “birdwatchers` .possibLe_dupLicate_emaiL ”TO 'lena'@'. | 
| GRANT SELECT ON “birdwatchers` .birdwatcher_prospects_import ”TO ‘lena! @'. 。 | 
| GRANT SELECT (membership_type, human_id, name_ Last， formal_title, name _first)| 
| ON “birdwatchers` .humans`” TO 'lena'@'. | 
| GRANT SELECT ON birdwatchers™. “btrd. tdentiftication tests’ TO 'lena'@'...' | 
| GRANT SELECT ON “birdwatchers` .birdwatcher_prospects ”TO 'lena'@'...' | 
| GRANT SELECT ON “birdwatchers ` .bird_sightings ”TO 'lena'@'...’' 
| GRANT SELECT ON “birdwatchers` .birding_events” TO 'lena'@'...’" 
| GRANT SELECT ON “birdwatchers` .random_numbers ”TO 'lena'@'...' 


在 Grants 表 中 ， 你 会 发 现 该 账号 有 很 多 权限 。 这 是 因为 我 们 是 按 表 和 列 来 给 它 授 权 ， 而 
不 仅仅 是 数据 库 层 面 的 授权 。 但 更 重要 的 是 ， 这 些 权 限 现在 都 属于 lena@stankoskahouse. 























13.7 用 户 角色 


给 一 个 人 创建 多 个 用 户 账号 是 很 繁琐 的 工作 。 试 想 在 你 的 管理 范围 内 ， 有 很 多 像 Lena 
Stankoska 这 样 的 用 户 ， 你 需要 给 他 们 每 人 创建 多 个 账号 。 如 果 有 位 用 户 因为 要 顶替 某 个 休 
假 的 人 ， 而 需要 在 一 段 时 间 内 接管 一 些 权 限 ， 那 你 就 得 为 他 授予 额外 的 权限 ， 然 后 过 段 时 
间 又 将 它们 回收 。 这 是 很 繁琐 的 ， 会 引发 安全 问题 (例如 ， 不 小 心 授予 了 太 多 权限 )， 而 
且 令 控 管 变 得 低 效 (检查 这 么 多 账号 很 困难 )。 所 以 ， 我 们 要 用 更 好 的 方法 。 

这 个 方法 就 是 在 MariaDB 10.0.5 版 本 中 引入 的 用 户 角色 ， 而 MySQL 是 没有 的 。 用 户 角色 
让 你 可 以 创建 一 个 更 高 层次 的 概念 ， 即 角色 ， 并 将 它 授 予 指定 的 用 户 账号 。 一 般 来 说 ， 每 
个 用 户 账号 都 有 能 完成 日 常任 务 的 所 需 权限 ， 而 当 需 要 做 一 些 非 日 党 的 工作 时 ， 可 以 临时 
赋予 它 某 种 特定 的 角色 ， 等 它 完 成 相关 工作 之 后 ， 再 取消 这 次 “赋予 "。 这 样 做 很 方便 。 
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下 面 来 看 一 个 示例 。 

早 前 ， 我 们 给 Lena Stankoska 创建 了 一 个 具有 FILE 权限 的 账号 admin_import， 使 她 能 执行 
LOAD DATA INFILE 语句 ， 把 文本 文件 中 的 数据 导入 数据 库 (此 语句 及 其 过 程 将 在 第 15 章 讲 
解 )。 现 假设 还 有 另外 两 个 用 户 ，Max Mether 和 Ulf Sandberg， 他 们 也 会 偶尔 做 这 项 工作 。 
虽然 我 们 可 以 不 用 再 给 他 们 分 别 创建 用 于 导入 数据 的 账号 ， 而 只 给 他 们 admin_import 的 密 
码 ， 但 这 样 做 不 够 专业 、 不 够 安全 。 比 较 好 的 做 法 是 ， 用 CREATE ROLE 语句 来 创建 一 个 名 
为 admin_import_role 的 角色 ， 并 把 该 角色 赋予 Max Mether 和 Ulf Sandberg。 


如 果 你 安装 的 是 MariaDB ， 那 么 可 以 输入 以 下 命令 : 


CREATE ROLE 'admin import_role'; 


























GRANT FILE ON *.* 

TO ‘admin_import_role'@localhost; 
第 一 条 语句 用 于 创建 角色 。 而 第 二 条 语句 用 GRANT 来 给 该 角色 授予 导入 文件 所 需 的 FILE 权 
限 。 接 下 来 ， 让 我 们 给 Max Mether 和 UIf Sandberg 赋予 这 个 角色 (假设 这 两 个 人 的 用 户 账 
号 都 创建 好 了 )。 在 MariaDB 中 ， 输 入 以 下 命令 : 

GRANT 'admin _ import_role' TO 'max'QLocaLhost; 

GRANT 'admin import_role' TO 'uULf'QLocaLhost; 
这 样 一 来 ，Max Mether 和 Ulf Sandberg 便 可 以 在 有 需要 时 ， 担 任 这 个 角色 。 比 如 说 ，Max 
Mether 可 以 在 登录 MariaDB 后 ， 执 行 以 下 命令 : 


SET ROLE ‘admin_import_role'; 





LOAD DATA INFILE 


SET ROLE NONE; 


如 你 所 见 ，Max Mether 将 自己 设 为 admin_import_role 后， 执行 了 LOAD DATA INFILE 语句 。 
这 里 ， 我 隐藏 了 该 语句 的 细节 以 及 他 可 能 输入 的 其 他 语句 ， 以 便 我 们 只 关注 用 户 角色 这 一 
话题 。 最 后 ， 他 将 自己 的 角色 设 为 NONE， 以 脱离 角色 。 


角色 有 一 个 缺点 : 它 只 在 当前 会 话 有 效 。 当 使 用 其 他 外 部 实用 程序 (如 
mysqldump) 时 ， 这 就 有 点 麻烦 。 如 果 在 命令 行 开启 mysql 客户 端 ， 并 为 用 户 
账号 设置 角色 ， 然 后 退出 mysql 或 在 另 一 终端 执行 nysqldumnp， 那 么 dump 会 
在 另 一 个 会 话 中 。 而 在 该 会 话 中 没有 设置 角色 ， 所 以 没有 权限 。 
































用 户 角 色 很 好 用 ， 而 且 比 创建 一 大 堆 用 户 账号 和 密码 并 给 每 一 个 授权 要 简单 得 多 。 它 是 临 
时 授权 的 理想 工具 。 对 于 管理 员 来 说 ， 它 能 使 用 户 账号 和 权限 的 管理 更 轻松 。 而 用 户 则 只 
需 输 入 一 个 用 户 名 和 密码 ， 即 可 进行 所 有 的 工作 。 必 要 的 时 候 ， 他 们 只 需要 被 赋予 一 个 角 
色 。 当 然 ， 应 该 只 在 必要 时 才 设 置 角色 ， 并 在 完事 后 设 回 NONE。 
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13.8 小结 


在 你 刚 开 始 做 数据 库 管 理 员 的 时 候 ， 可 能 只 想 创 建 少 量 的 用 户 账号 ， 甚 至 只 想 使 用 root。 
但 其 实 ， 应 该 学 会 使 用 各 种 用 户 账号 ， 而 不 是 只 用 root。 另 外 ， 也 应 该 学 会 给 每 个 人 分 配 
至 少 一 个 私人 账号 (如果 可 以 的 话 ， 尽 量 不 允许 分 享 账号 ) 。 还 要 学 会 给 每 个 账号 仅 授予 
必要 的 权限 。 这 种 做 法 可 能 很 乏味 ， 却 很 安全 一 一 它 除 了 能 保护 敏感 数据 ， 还 能 防止 数据 
丢失 以 及 表 被 误 改 或 误 删 。 

甚 实 我 们 还 未 谈 及 一 些 关 于 用 户 账 号 和 安全 措施 的 选项 。 例 如 ， 可 以 用 一 些 选 项 限制 某 个 
账号 每 次 或 每 小 时 的 连接 数 。 而 密码 的 加 密 和 解密 函数 也 还 有 不 少 。 因 为 考虑 到 你 不 会 经 
常 使 用 它们 (特别 是 对 于 新 手 来 说 )， 所 以 本 书 不 讲 这 些 。 可 以 在 我 的 另 一 本 书 《MySQL 
核心 技术 手册 》 中 (http://shop.oreilly.com/product/9780596514334.do)， 或 MySQL 资源 网 
上 (http:/mysqlresources.com/) 学 习 这 些 内 容 。 


13.9 习题 


尽管 你 可 以 随时 回 到 本 章 翻 看 CREATE USER、GRANT、REVOKE 和 DROP USER 的 用 法 ， 但 应 该 

掌握 好 它们 ， 不 要 每 次 用 时 都 翻 书 。 要 想 记 住 它们 的 语法 ， 可 以 借助 SHOW GRANTS。 如 有 果 

你 熟悉 它们 ， 那 么 会 更 愿意 调整 用 户 账 号 的 权限 。 否 则 ， 只 好 让 数据 库 部 门 的 员工 分 享 同 

一 个 账号 ， 并 给 该 账号 分 配 所 有 权限 。 为 了 让 你 对 它们 有 更 次 刻 的 印象 ， 我 给 你 准备 了 以 

下 习题 。 不 过 说 到 底 ， 能 否 贯 彻 安全 措施 ， 还 得 看 个 人 意志 。 

(1) 登录 你 的 服务 器 ， 使 用 CREATE USER 创建 一 个 管理 员 账 号 ， 用 户 名 为 admin_boss， 主 机 
名 为 localhost。 
然后 ， 使 用 GRANT， 让 这 个 账号 在 rookery 和 birdwatchers 上 拥有 ALL 权限 ， 并 授予 它 
SUPER， 使 它 能 更 改 服 务 器 设置 。 同 时 ， 带 上 GRANT OPTION 权限 (13.3.4 节 讲 过 )。 你 上 
能 需要 分 开 几 次 写 GRANT。 记 住 ， 至 少 使 用 一 次 IDENTIFIED BY 子 句 ， 这 样 才能 给 它 设 
置 密码 。 
创建 好 这 个 账号 之 后 ， 试 试 退 出 MySQL， 并 用 admin_boss 重新 登录 ， 看 密码 是 否 有 
效 。 之 后 ， 不 再 用 root， 而 改 用 它 。 

(2) 以 admin_boss 登录 之 后 ， 用 GRANT 语句 创建 一 个 从 localhost 登录 且 名 为 sakari 的 用 户 。 
只 让 它 在 rookery 和 birdwatchers 上 有 SELECT、INSERT 和 UPDATE 权限 。 记 得 给 它 设置 
密码 。 要 求 所 有 授权 都 写 在 一 个 GRANT 中 。 做 完 后 ， 退 出 MySQL。 

用 刚才 创建 的 sakari@localhost 登录 MySQL。 执 行 SHOW DATABASES， 确 认 是 否 只 能 看 到 
两 个 默认 数据 库 和 两 个 我 们 刚才 授权 的 数据 库 。 然 后 用 SELECT 语句 查询 birdwatchers 
数据 库 中 humans 表 的 所 有 行 ， 接 着 用 INSERT 插入 少量 数据 ， 再 用 UPDATE 修改 至 少 一 列 
你 刚才 录入 的 数据 。 正 常 来 阅 ， 你 应 该 有 权限 完成 这 些 操作 。 如 果 不 能 ， 用 admin_boss 
登录 ， 和 再 用 SHOW GRANTS 检查 sakari@localhost 的 权限 设置 。 改 正 错 误 ， 然 后 再 测试 这 
个 用 户 账号 。 

接着 ， 党 试用 DELETE 删除 刚才 加 入 的 行 (用 sakari@localhost 登录 ， 而 非 admin_boss)。 
如 无 意外 ， 应 该 是 不 能 执行 的 。 
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(3) 以 admin_boss 登录 后 ， 用 REVOKE 回收 在 第 2 题 中 授予 sakari@localhost 的 INSERT 和 
UPDATE 权限 。 做 完 后 ， 退 出 MySQL。 
以 sakari@localhost 登录 ， 党 试用 INSERT 往 humans 表 插 入 一 行 数据 。 不 过 这 应 该 是 不 
成 功 的 。 如 果 能 插入 ， 则 以 admin_boss 登录 ， 想 想 刚 才 回 收 权限 时 有 什么 搞 错 了 ， 并 
修正 。 然 后 再 试 试用 sakari@localhost 插入 数据 。 

(4) 以 admin_boss 登录 ， 修 改 sakari@localhost 的 密码 (13.6 节 讲 过 )。 做 完 后 ， 退 出 
MySQL 。 
使 用 新 密码 以 sakari 登录 ， 然 后 按 几 次 向 上 的 方向 键 ， 看 看 有 没有 出 现 sakari@localhost 
的 密码 。 如 果 有 ， 那 就 意味 着 其 他 用 户 有 可 能 也 会 看 到 这 个 密码 。 检 查 过 后 ， 退 出 
MySQL。 

在 自己 的 计算 机 (不 是 服务 器 ) 的 命令 行 中 ， 用 mysqt 执行 SELECT 语句 以 及 
PASSWORD() 函数 ， 生 成 一 个 经 过 加 密 的 密码 ， 以 用 于 sakari@localhost。 记 得 要 与 之 前 
的 密码 不 同 。 若 忘 了 怎么 做 ， 可 参考 13.6 市 。 
然后 ， 以 admin_boss 登录 ， 把 sakari@localhost 的 密码 设置 成 刚才 加 密 后 的 密码 ， 这 次 
不 需要 用 PASSWORD()。 然 后 退出 并 用 新 密码 以 sakari 登录 。 用 向 上 的 方向 键 确 认 密 码 是 
加 密 后 的 字符 串 ， 而 非 明文 。 

(5) 以 admin_boss 登录 ， 用 DROP USER 删除 sakari@localhost。 然 后 退出 ， 再 试 试 能 不 能 以 
sakari 登录 。 正 常 来 说 ， 是 不 能 的 。 
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第 14 章 


数据 库 的 备份 与 恢复 











数据 库 的 创建 通常 要 依靠 许多 人 的 力量 ， 有 时 人 数 甚至 高 达 数 千 。 创 建 数据 库 的 机 构 聘 请 
开发 和 管理 人 员 ， 除 此 之 外 还 有 提供 数据 的 人 ， 他 们 可 能 是 雇员 ， 也 可 能 是 会 员 。 但 数据 
库 的 大 部 分 数据 可 能 来 自 其 他 人 ， 例 如 客户 以 及 通过 网 络 提供 数据 的 无 名 人 士 。 数 据 量 可 
能 非常 大 。 即 使 是 一 个 小 网 站 ， 它 也 可 能 会 积累 数 千 行 数据 。 而 大 网 站 更 可 能 有 数 百 万 行 
数据 。 数 据 的 收集 需要 大 量 的 人 力 ， 而 数据 很 容易 丢失 ， 一 个 小 小 的 硬盘 错误 就 会 导致 莫 
剧 发 生 。 所 以 ， 我 们 需要 以 正确 的 方式 定期 进行 数据 备份 ,数据 非常 多 ， 而 且 很 多 任务 都 
依赖 它 。 

如 果 你 准备 做 数据 库 管理 员 ， 那 一 定 要 懂得 如 何 备份 和 恢复 数据 库 。 需 要 计划 好 哪些 数据 
要 备份 ， 什 么 时 候 做 备份 ， 以 及 备份 到 哪里 。 此 外 ， 还 要 偶尔 检查 是 否 备份 成 功 ， 以 防 要 
做 恢复 时 才 发 现 没 备份 好 。 还 应 熟 习 如 何 恢复 备份 ， 以 便 出 现 问题 时 能 快速 解决 。 以 上 提 
到 的 这 几 点 ， 本 章 都 会 介绍 。 


14.1 备份 


mysqLdump 是 MySQL 和 MariaDB 上 最 好 的 备份 工具 之 一 。 它 包含 两 个 服务 器 ， 而 且 不 需 
要 任何 成 本 。 也 许 你 已 经 安装 它 了 。 它 最 大 的 优点 是 ， 无 需 关闭 服务 器 就 能 做 备份 〈 如 
果 对 数据 一 致 性 有 很 高 要 求 ， 那 你 可 能 需要 规范 它 的 使 用 )。 备 份 工 具 还 有 很 多 〈 比 如 
MySQL Enterprise Backup 和 Percona XtraBackup)， 其 中 有 些 带 了 GUI， 有 些 功能 更 多 。 你 
可 以 从 Sveta Smirnova 写 的 《MySQL 排 错 指南 》 中 了 解 其 他 类 型 的 备份 和 工具 。 不 过 ， 
mysqtdump 是 最 流行 的 备份 工具 ， 所 以 ， 作 为 管理 员 新 手 ， 你 应 该 熟悉 使 用 它 的 方法 (就 
算 你 以 后 会 用 到 商业 版 工具 )。 而 本 章 也 将 用 它 来 演示 。 


它 其 实 很 简单 : 首先 查询 每 个 数据 库 和 每 个 表 的 结构 与 数据 ， 然 后 把 查 出 的 所 有 内 容 导 
出 到 文本 文件 中 。 它 创建 的 默认 文本 文件 被 称 为 dump 文件 ， 里 面包 含 重建 数据 库 和 数 
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据 必 需 的 SQL 语句 。 如 果 打 开 这 个 文件 ， 你 会 看 到 一 些 CREATE TABLE 语句 ， 以 及 大 量 的 
INSERT 语句 。 这 看 似 累 费 ， 但 实际 上 很 简单 ， 且 便于 管理 。 


mysqldump 提供 很 多 选项 。 可 以 备份 所 有 数据 库 ， 也 可 以 指定 只 备份 某 些 数 据 库 ， 甚 至 可 以 
指定 只 备份 某 些 表 。 本 市 就 来 介绍 这 些 选项 ， 并 给 出 一 些 例子 ， 告 诉 你 它们 的 常用 组 合 。 


14.1.1 备份 所 有 数据 库 


备份 所 有 数据 库 、 所 有 表 ， 以 及 其 中 的 数据 ， 是 最 简单 的 。 用 mysqldump 很 容易 就 能 做 到 。 
现在 就 请 在 服务 器 的 命令 行 中 ， 使 用 上 一 章 创建 的 admin_backup 账号 ， 执 行 以 下 命令 。 你 
可 能 需要 将 /data/backups/ 改 成 你 的 服务 器 上 存在 的 路 径 。 又 或 者 ， 不 写 目录 路 径 ， 而 在 当 
前 目录 下 创建 dump 文件 。 

mysqldump --user=admin_backup \ 


--password --lock-all-tables 
--all-databases > /data/backups/all-dbs. sql 


这 个 命令 用 到 了 以 下 选项 。 

。 --User=admin_pacKkup 
让 mysqLdump 以 admin_backup 账号 与 MySQL 服务 器 进行 交互 。13.2.1 市 已 演示 过 如 
何 创 建 这 一 账号 ， 所 以 ， 如 果 你 当时 没有 跟着 做 ， 那 现在 就 得 创建 一 个 拥有 适当 权限 
的 用 户 账号 。 虽 然 你 可 能 想 用 root 来 做 备份 ， 但 另 建 一 个 管理 员 账号 来 处 理 这 种 事情 ， 
才 是 正确 的 做 法 (就 像 这 里 用 admin_backup)。 用 于 备份 的 账号 只 需要 锁 表 和 读 表 的 
权限 。 

。 --password 
让 mysqldump 在 下 一 行 弹出 输入 密码 的 提示 符 。 它 的 效果 如 同 mysqL。 如 果 这 个 备份 命 
令 要 写 在 让 cron 执行 的 shell 脚本 中 ， 那 这 个 选项 就 要 写成 --password=my_pwd (请 在 
my_pwd 处 填 真实 密码 ， 即 明文 写 出 )。 所 以 ， 不 要 用 root， 以 免 暴 露 密 码 。 

。 --lock-all-tables 

在 做 备份 前 ， 先 让 MySQL 锁 住所 有 表 ， 然 后 直到 备份 完成 才 解 锁 。 对 于 繁忙 的 数据 库 
来 说 ， 长 时 间 锁 住所 有 表 会 有 很 大 影响 。 后 面 我 们 会 介绍 其 他 锁定 方法 。 

。 --all-databases 
导出 所 有 数据 库 。 下 一 小 节 会 介绍 另 一 个 能 指定 备份 部 分 数据 库 的 选项 。 

命令 行 中 的 大 于 号 是 让 shell 把 标准 输出 (STDOUT) 重 定向 ， 使 备份 能 被 导入 后 面 指定 的 文 

件 。 请 按 你 的 系统 和 喜好 来 设置 该 文件 的 路 径 和 名 字 。 

这 样 得 到 的 dump 文件 就 会 是 一 行 数据 一 条 INSERT。 如 果 想 一 个 表 一 条 INSERT， 可 加 上 

--extended-insert 选项 ， 如 此 一 来 ， 生成 的 dump 文件 会 小 一 些 ， 而 且 在 恢复 数据 库 时 ， 

比 一 行 数据 一 条 INSERT 更 快 。 如 果 你 的 服务 器 默认 在 dump 文件 中 生成 扩展 插入 ， 而 你 更 

喜欢 它们 作为 单独 的 语句 ， 那 就 用 --skip-extended-insert 选项 。 

生成 的 INSERT 语句 不 含 列 名 ， 它 只 是 把 值 按 列 的 顺序 来 排 。 如 果 想 加 上 列 名 ， 那 就 加 上 


--ComptLete-insert 选项 。 
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在 nysqtdump 后 带 选 项 时 ， 选 项 的 排列 顺序 无 关 紧 要 ， 但 其 取 值 必须 紧 跟 选 
项 。 此 外 ， 重 定向 符号 必须 写 在 最 后 。 准 确 来 说 ， 它 不 是 mysqtdump 的 选项 ， 
而 是 shell 运算 符 。 总 的 来 说 ， 选 项 的 排列 顺序 类 似 于 命令 的 排列 顺序 。 














MySQL 的 工具 过 去 常常 提供 一 些 简 短 形式 的 选项 ， 比 如 用 -u 代表 - -user。 但 是 这 些 简短 
形式 现在 已 不 被 推荐 ， 甚 至 在 未 来 的 版 本 中 可 能 会 被 取消 。 


用 mysqldump 给 InnoDB 表 或 其 他 事务 型 的 表 做 备份 时 ， 最 好 加 上 - -singte- 
transaction 选项 。 这 能 提高 数据 的 一 致 性 。 直 到 dump 完成 ， 它 才 会 在 表 中 
做 改动 。 但 是 ， 这 个 选项 会 令 --lock-tables 失效 ， 也 就 是 说 不 能 保证 同一 
个 数据 库 中 MyISAM 表 的 数据 一 致 。 要 避免 这 种 问题 ， 可 以 对 整个 数据 库 
的 表 都 用 同一 种 存储 引擎 ， 又 或 者 分 别 备份 InnoDB 表 和 MyISAM 表 。 














用 mysqldump 一 次 性 备份 所 有 数据 库 ， 可 能 会 令 dump 文件 过 大 。 对 于 定期 备份 的 小 型 数 
据 库 来 说 ， 这 是 可 以 接受 的 。 但 对 于 大 型 数据 库 来 说 ， 完 成 备份 就 会 很 花 时 间 ， 并 且 ， 在 
这 个 过 程 中 一 直 锁 表 会 很 妨碍 别人 的 操作 ， 最 后 恢复 起 来 也 很 麻烦 。 如 果 不 想 出 现 这 种 问 
题 ， 就 需要 采取 一 些 巧 妙 的 方法 。 例 如 ， 分 开 备 份 每 个 大 数据 库 ， 这 样 就 能 将 原本 较 大 的 
dump 文件 分 成 几 个 小 一 些 的 dump 文件 。 也 可 以 选择 在 较为 空闲 的 时 间 备份 那 些 平时 很 活 
跃 的 大 数据 库 。 关 于 如 何 分 库 备 份 以 及 如 何 决定 备份 策略 ， 我 们 会 在 以 后 讨论 。 现 在 ， 先 
来 熟悉 dump 文件 。 


备份 所 有 数据 库 会 有 一 个 安全 问题 ， 因 为 这 将 把 nysqt 数据 库 的 user 表 也 导 
出 来 。 而 该 表 含 有 用 户 名 和 密码 。 如 果 想 把 它 排除 在 外 ， 可 以 在 创建 dump 
文件 时 ， 给 mysqldump 命令 加 上 --ignore-table=mysql.user。 而 如 果 只 想 侦 
尔 备 份 nysql.user， 最 好 另 开 一 个 账号 ， 并 且 指 定 导 出 到 受 保护 的 目录 或 其 
他 安全 的 地 方 。 



























































14.1.2 ”理解 dump 文 件 

运行 完 上 一 小 节 的 mysqldump 后 ， 用 普通 的 文本 编辑 器 打开 生成 的 dump 文件 ， 看 看 它 的 
内 容 。 你 会 发 现 它 是 这 样 的 : mysqLdump 先 给 dump 文件 写 和 注释， 设置 一 些 变量 ， 然 后 列 出 
CREATE DATABASE、CREATE TABLE 和 许多 INSERT 语句 。 下 面 我 们 就 来 研究 一 下 部 分 内 容 ， 以 
更 好 地 理解 dump 文件 。 这 对 恢复 数据 库 也 是 有 帮助 的 。 

首先 看 看 它 的 头 部 。 以 下 是 上 例 所 产生 的 dump 文件 的 前 儿 行 : 


-- MySQL dump 10.14 Distrib 5.5.39-MariaDB, for Linux (1686) 




















-- Host: localhost Database: rookery 


-- Server version 5.5.39-MariaDB 


第 一 行 显示 的 是 mysqldumnp、MySQL (本 例 中 是 MariaDB) 和 操作 系统 的 版 本 。 接 着 我 们 
看 到 ， 这 次 dump 是 从 localhost 登录 后 执行 的 。 并 且 ， 在 同一 行 ， 文件 标明 了 首先 备份 的 
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数据 库 的 名 字 。 然 后 ， 在 分 割 线 下 方 ， 是 MariaDB 的 版 本 。 虽 然 第 一 行 已 有 版 本 信息 ， 但 








这 里 单独 写 出 ， 显 得 更 清楚 。 























接着 就 是 一 大 堆 SET 语句 ， 如 示例 14-1 所 示 。 


示例 14-1: dump 文件 中 的 条 件 性 SET 语句 


/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */; 
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */; 
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */; 


/*!40101 SET NAMES utf8 */; 


/*!40103 SET @OLD_TIME_ ZONE=@@TIME _ ZONE */; 


/*!40103 SET TIME_ZONE='+00:00' */; 


/*!40014 SET @OLD_UNIQUE CHECKS=@@UNIQUE_ CHECKS, UNIQUE CHECKS=0 */; 

/*!40014 SET @OLD_FOREIGN KEY CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */; 
/*!40101 SET @OLD_SQL MODE=@@SQL MODE, SQL MODE='NO_AUTO_VALUE_ON_ZERO' */; 
/*!40111 SET @OLD_SQL NOTES=@@SQL NOTES, SQL_NOTES=0 */; 


这 些 SET 语句 处 于 /* 和 */ 之 间 ， 看 起 来 像 是 不 会 被 执行 的 注释 。 但 看 清楚 ， 开 头 其 实 
是 /*!， 而 不 只 是 /*， 这 是 MySQL 和 MariaDB 的 条 件 性 语句 。 在 做 恢复 时 ，MySQL 和 
MariaDB 会 检查 感叹 号 后 的 版 本 号 是 否 与 自身 匹配 ， 再 决定 是 否 执行 。 而 在 dump 文件 中 ， 








注释 以 -- 开头 。 


可 以 在 mysqldump 后 加 上 以 下 一 个 或 多 个 选项 ， 





。 --skip-add-drop-table 





以 减 小 dump 文件 的 大 小 。 


不 带 DROP TABLE 语句 ， 即 不 在 恢复 时 删除 原 表 。 


。 --skip-add-locks 
不 带 锁 表 语句 。 
。 --Sskip-comments 
不 带 注释 。 
。 --skip-disable-keys 
不 带 使 表 中 的 索引 和 暂时 失效 的 语句 。 


。 --Sskip-set-charset 


不 带 SET NAMES， 即 不 在 恢复 时 设置 字符 集 。 


。 --Compact 


使 用 上 述 所 有 选项 。 


上 述 选 项 中 的 某 些 是 有 风险 的 。 例 如 ， 做 恢复 时 所 在 的 数据 库 的 默认 字符 集 可 能 与 原 数 据 
库 的 不 同 ， 如 果 使 用 --skip-set-charset， 那 么 就 可 能 用 错字 符 集 。 而 如 果 使 用 --skip- 


add-tocks， 则 可 能 导致 数据 不 一 致 。 
因为 dump 文件 不 仅 能 用 于 在 原 服务 器 上 




















份 包 


[恢复 数据 ， 还 可 以 用 于 将 数据 复制 到 另 一 


个 服务 器 ， 所 以 需要 用 条 件 性 语句 来 判断 在 另 一 个 服务 器 上 应 执行 什么 命令 。 这 样 才能 使 


创建 表 和 插入 数据 时 不 会 出 错 。 执 行 dump 文 们 





原本 的 样子 。 





F 时 ， 它 会 让 数据 库 和 表 得 以 恢复 或 重建 成 
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现在 我 们 回顾 第 一 个 SET 命令 : 


/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */; 


它 一 开始 就 指定 只 在 MySQL 或 MariaDB 4.01.01 及 以 上 版 本 执行 此 命令 。mysqldump 就 
是 用 这 种 方式 来 确保 新 版 才 有 的 功能 不 会 在 旧版 中 被 调用 。 我 们 通常 认为 ， 一旦 某 个 
版 本 支持 一 个 功能 ， 那 么 未 来 的 版 本 都 会 继续 支持 它 。 而 接着 的 语句 ， 就 是 另存 全 局 
变量 CHARACTER_SET_CLIENT 当前 的 值 。 如 果 回 顾 示 例 14-1， 会 发 现在 后 续 的 命令 中 ， 
CHARACTER_SET_RESULTS 和 COLLATION_CONNECTION 也 被 另存 了 。 然 后 ， 第 四 行将 这 三 个 变量 
都 设 成 utf8， 因 为 NAMES 指 代 这 三 个 变量 。 
再 跳 到 dump 文件 的 末尾 ， 会 看 到 如 下 一 堆 SET 语句 : 


/*140163 SET TIME_ZONE=@OLD_TIME_ZONE */; 




















/*!40101 SET SQL_MODE=@OLD_SQL_MODE */; 

/*140014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */; 
/*140014 SET UNIQUE CHECKS=@OLD UNIQUE CHECKS */; 

/*!40101 SET CHARACTER_SET_CLIENT=@OLD_CHARACTER_SET_CLIENT */; 
/*!40101 SET CHARACTER_ SET_RESULTS=@OLD_CHARACTER_SET_RESULTS */; 
/*!40101 SET COLLATION_ CONNECTION=@OLD_COLLATION_CONNECTION */; 
/*!40111 SET SQL_NOTES=@OLD_ SQL _NOTES */; 


- Dump completed on 2014-09-14 6:13:40 


但 是 ， 它 们 与 刚才 的 顺序 相反 。 这 些 SET 语句 所 做 的 就 是 用 刚 开 始 创建 的 变量 将 这 些 全 局 
变量 恢复 成 原本 的 设置 。 在 dump 文件 中 ， 你 会 看 到 很 多 这 样 的 条 件 性 语句 。 而 为 了 让 用 
户 的 操作 不 受 这 些 被 改变 的 全 局 变量 影响 ， 应 该 在 做 恢复 时 进行 锁 表 。 


现在 回 到 开头 的 条 件 性 语句 ， 看 看 其 后 有 什么 : 


























- Current Database: “rookery 


CREATE DATABASE /*!32312 IF NOT EXISTS*/ ‘rookery. 
/*!40100 DEFAULT CHARACTER SET latin1 COLLATE Latin1_bin */; 


USE “rookery  ; 


头 三 行 注释 提示 你 ， 当 查看 dump 文件 时 ， 你 会 知道 这 部 分 内 容 与 rookery 数据 库 有 关 。 
而 第 一 条 语句 理所当然 是 CREATE DATABASE。 不 过 ， 它 可 能 有 点 迷惑 人 ， 因 为 它 包含 了 两 条 
按 版 本 来 执行 的 条 件 性 语句 。 下 面 我 们 就 来 看 看 其 中 一 条 语句 。 

在 这 条 SQL 语句 中 ， 如 果 MySQL 的 版 本 是 3.23.12 及 以 上 ， 则 会 执行 IF NOT EXISTS。 这 
个 版 本 够 目 ， 而 IF NOT EXISTS 就 是 在 这 版 引入 的 ， 而 且 一 直 存 在 至 今 。 虽 然 现在 应 该 
不 会 有 服务 器 还 用 着 这 么 旧 的 MySQL， 但 mysqldump 还 是 会 加 上 这 个 检查 ， 以 防 万 一 。 
而 IF NOT EXISTS 本 身 则 更 值得 关注 。 它 的 作用 是 检查 rookery 数据 库 是 否 存 在 ， 如 果 存 
在 ， 则 不 用 CREATE DATABASE 来 创建 该 数据 库 。 顺 便 阅 一 下 ， 如 果 不 想 让 dump 文件 带 有 
CREATE DATABASE 和 CREATE TABLE， 可 以 在 mysqLdump 后 加 上 - -no-create-info 选项 。 
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最 后 一 条 SQL 语句 将 默认 数据 库 切 换 为 rookery。 你 可 能 会 觉得 奇怪 ， 为 什么 mysqldump 
要 用 USE 来 指定 数据 库 ， 而 不 是 在 后 面 的 SQL 语句 中 加 上 数据 库 的 名 字 ( 即 不 写成 INSERT 
INTO “rookery`. “bird_families`...) ? 虽然 这 好 像 无 关 紧 要 ， 但 其 实用 USE 是 有 好 处 的 。 
当 你 想 用 dump 文件 中 的 表 和 数据 在 同一 个 服务 器 上 创建 新 的 数据 库 时 ， 只 需 编 辑 USE 语 
句 ， 在 一 个 地 方 改 动 数 据 库 的 名 字 即 可 (例如 ， 将 rookery 改 成 rookery_backup)。 这 样 ， 
就 创建 了 一 个 与 原 数 据 库 一 模 一 样 的 副本 ， 而 原 数 据 库 也 得 以 保留 。 我 们 会 在 后 面 深 入 讲 
解 这 个 问题 。 现 在 先 看 看 dump 文件 中 接 下 来 还 有 些 什么 。 


下 一 部 分 是 处 理 rookery 的 第 一 个 表 。 如 下 所 示 ， 我 们 看 到 了 bird_families 的 表 结 构 : 





















































- Table structure for table ‘bird famitLies 


DROP TABLE IF EXISTS “bird_famiLies ; 


/*!40101 SET @saved_cs_client 
/*!40101 SET character_set_CLient 


@@character_set client */; 
utf8 */; 


CREATE TABLE ‘bird_families. ( 
“family_ id int(11) NOT NULL AUTO_INCREMENT, 
‘scientific name. varchar(100) COLLATE Latin1_bin DEFAULT NULL, 
‘brief_description. varchar(255) COLLATE Latin1_bin DEFAULT NULL, 
“order_id. int(11) DEFAULT NULL, 
PRIMARY KEY (‘family id*), 
UNIQUE KEY ‘scientific name. (‘scientific name') 

) ENGINE=MyISAM AUTO_INCREMENT=334 DEFAULT CHARSET=Latin1 COLLATE=Latin1_bin; 


/*!40101 SET character_set client = Qsaved_cs_CLient */; 


这 里 的 第 一 句 可 能 会 令 你 警惕 。 这 是 应 该 的 ， 因 为 这 条 DROP TABLE 语句 正 要 删除 bird_ 
families 表 。 按 理 说 ， 即 使 我 们 删除 该 表 ， 也 不 应 该 会 丢失 数据 ， 因 为 紧 接着 我 们 就 会 重 
建 该 表 ， 并 把 创建 dump 文件 时 该 表 拥 有 的 数据 都 导 回去 。 但 是 ， 如 果 在 dump 文件 创建 
后 ，bird_families 表 中 的 数据 有 改动 的 话 ， 那 么 当 我 们 把 表 恢 复 到 之 前 的 状态 时 ， 这 些 改 
动 就 会 丢失 。 如 果 想 加 上 这 些 改动 ， 需 要 采取 一 些 方法 。 一 种 方法 是 ， 像 之 前 提 到 的 ， 修 
改 USE 语句 ， 将 所 有 的 结构 和 数据 导入 一 个 临时 数据 库 ， 然 后 就 可 以 在 两 个 数据 库 之 间 进 
行 一 些 合 并 。 在 某 些 情况 下 ， 可 以 考虑 使 用 REPLACE 而 不 是 INSERT 来 进行 合并 。 另 一 种 方 
法 ， 就 是 去 掉 DROP TABLE， 并 把 CREATE TABLE 中 的 表 名 换 成 新 的 。 我 们 会 在 14.2 节 中 讲 
解 这 些 做 法 。 

IF EXISTS 选项 可 以 确保 只 有 当 表 存在 时 ， 做 恢复 才 会 删 表 。 如 果 表 不 存在 ， 而 又 不 加 此 
语句 ， 导 致 执行 了 DROP TABLE， 那 么 就 会 报错 ， 使 恢复 中 止 。 


DROP TABLE 之 后 是 有 关 表 和 客户 端 配置 的 条 件 性 语句 ， 然 后 才 是 CREATE TABLE。 这 个 
CREATE TABLE 与 SHOW CREATE TABLE 看 到 的 结果 是 一 样 的 。 最 后 ， 我 们 将 变量 重 置 回 原 
状态 。 


这 样 ，bird_families 就 准备 好 导入 数据 了 。 所 以 ， 下 一 部 分 是 如 下 语句 : 
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-- Dumping data for table ‘bird families. 


LOCK TABLES ‘bird_families. WRITE; 
/*!40000 ALTER TABLE ‘bird_families’ DISABLE KEYS */; 


INSERT INTO “bird_families. VALUES 


/*!40000 ALTER TABLE ‘bird_families. ENABLE KEYS */; 
UNLOCK TABLES; 


注释 之 后 有 一 条 锁定 bird_families 的 LOCK TABLES 语句 。 它 带 有 WRITE 选项 ， 使 得 恢复 
过 程 中 其 他 人 不 能 读 取 或 修改 该 表 的 数据 。 这 里 会 出 现 一 个 问题 ， mysqLdump 备份 哪个 表 ， 
就 只 锁定 该 表 的 wRITE， 而 让 其 他 未 备份 的 表 依 然 可 以 被 别人 读 写 。 你 可 能 觉得 这 样 挺 好 ， 
但 其 实 可 能 会 造成 数据 不 一 致 。 

例如 ， 假 设 在 备份 的 过 程 中 ， 你 刚 导 完 birdwatchers 数据 库 的 bird_sightings 表 的 数据 ， 
正 准备 处 理 humans 表 。 而 就 在 这 时 ， 你 执行 了 DELETE， 删 掉 了 humans 表 中 的 某 个 人 ， 以 
及 bird_sightings 中 的 相关 条 目 。 然 后 ，mysqLdump 开始 备份 humans 表 。 那 么 ， 在 恢复 整 
个 birdwatchers 数据 库 时 ， 你 就 会 发 现 bird_sightings 表 中 有 某 个 人 的 记录 ， 但 此 人 在 
humans 表 中 不 存在 。 


如 果 你 的 数据 库 并 不 是 经 常 有 人 访问 ， 那 么 就 不 太 会 出 现 这 个 问题 。 但 要 是 你 想 确 保 数 据 
一 致 性 ， 可 以 在 执行 mysqldump 时 加 上 - -Lock-tabtes 选项 。 这 样 就 能 在 备份 之 前 ， 先 把 
数据 库 里 的 所 有 表 锁 住 ， 并 在 备份 结束 后 才 解 锁 。 在 备份 多 个 数据 库 时 ， 它 也 只 会 锁定 正 
在 备份 的 那个 数据 库 ， 然 后 在 备份 下 一 个 数据 库 前 ， 将 刚才 的 那个 数据 库 解锁 。 如 果 你 要 
保持 多 个 数据 库 之 间 的 一 致 性 〈 换 句 话 说， 有 一 个 数据 库 的 数据 依赖 于 另 一 个 数据 库 )， 
那么 可 用 - -Lock-alLL-tabltes 将 所 有 数据 库 的 所 有 表 都 锁定 ， 直 至 整个 备份 完成 。 


在 刚才 的 示例 中 ，LOCK TABLES 后 面 还 跟 了 条 件 性 语句 ALTER TABLE...DISABLE KEYS， 它 的 
作用 是 使 bird_families 表 的 键 失 效 。 这 种 做 法 可 令 恢复 的 时 间 缩 短 ， 因 为 这 样 MySQL 
就 不 会 在 每 次 执行 INSERT (在 示例 的 省 略 号 处 ) 时 给 所 插入 的 条 目 建立 索引 ， 而 在 有 关 该 
表 的 所 有 INSERT 完成 后 才 建 ， 即 示例 中 的 第 二 个 ALTER TABLE。ENABLE KEYS 所 使 用 的 算法 
很 高 效 ， 适 用 于 一 次 性 对 整个 表 迅 速 建立 索引 。 


如 果 服 务 器 默认 使 用 --disabte-keys， 那 么 dump 文件 就 会 带 有 DISABLE 
KEYS 之 类 的 条 件 性 组 件 。 若 在 mysqtdump 创建 的 dump 文件 中 找 不 到 这 些 
组 件 ， 那 就 说 明 服 务 器 并 没有 默认 使 用 --disable-keys。 要 解决 这 个 问 
题 ， 可 以 在 执行 mysqldump 时 加 上 它 ， 或 者 将 它 加 到 MySQL 配置 文件 的 
[mysqLdump] 部 分 中 。 






















































































最 后 一 句 UNLOCK TABLES 是 对 本 部 分 开头 锁定 的 表 进行 解锁 。 
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总 的 来 说 ， 每 个 表 的 基本 模式 是 ， 先 建立 表 结 构 ， 再 导入 数据 。 为 了 建立 表 结 构 ，dump 
文件 一 般 包 含 一 些 SQL 语句 ， 用 于 删 表 、 设 置 临时 变量 、 重 建 该 表 ， 以 及 恢复 变量 。 为 了 
在 重建 表 时 处 理 数据 ， 它 会 先 锁 表 ， 然 后 禁 掉 表 上 的 键 ， 再 插入 所 有 数据 ， 最 后 重新 启用 
键 ， 并 把 表 解 锁 。 为 数据 库 中 的 每 个 表 都 执行 一 遍 这 个 过 程 ， 并 且 做 完 一 个 数据 库 ， 再 做 
另 一 个 ， 直 到 完成 所 有 数据 库 。 因 为 这 个 例子 是 备份 所 有 数据 库 ， 所 以 你 会 在 dump 文件 
中 看 到 这 样 的 顺序 。 


dump 文件 的 内 容 会 因 mysqLdump 版 本 和 服务 器 默认 设置 的 不 同 而 异 。 此 外 ， 它 还 会 受 备 份 
命令 所 带 的 选项 和 各 个 数据 库 本 身 的 特征 影响 。 不 过 ， 看 完 以 上 例子 ， 你 应 该 已 掌握 如 何 
阅读 dump 文件 。 下 面 ， 我 们 就 回 到 用 mysqLdump 执行 备份 这 个 话题 上 。 


14.1.3 备份 指定 的 数据 库 


在 讲解 dump 文件 的 内 容 之 前 ， 我 们 已 学 过 备份 所 有 数据 库 的 方法 ， 但 有 些 时候 ， 你 可 能 
只 想 备份 一 个 数据 库 或 一 些 指定 的 数据 库 。 那 么 到 底 要 怎么 做 呢 ? 


在 这 种 情况 下 ， 就 不 应 该 用 - -aLL-databases 了 ， 而 应 该 用 - -databases， 并 在 其 后 带 上 想 
备份 的 那些 数据 库 的 名 字 。 例 如 ， 用 以 下 命令 来 备份 rookery: 


mysqldump --user=admin_backup --password --lock-tables \ 
--verbose --databases rookery > rookery.sgl 


总 的 来 说 ， 与 之 前 的 写法 差不多 ， 只 是 这 次 我 们 指定 了 只 备份 rookery。 如 之 前 所 述 ， 对 
于 繁忙 的 服务 器 而 言 ， 分 别 备 份 多 个 数据 库 有 利于 减轻 服务 器 的 负担 ， 并 使 恢复 过 程 更 容 
易 掌控 。 顺 便 说 一 下 ， 如 果 只 想 备份 某 个 数据 库 的 结构 ， 而 不 需要 备份 数据 ， 那 么 可 以 再 
带 上 --no-data。 这 样 出 来 的 dump 文件 便 只 会 有 数据 库 和 表 的 结构 ， 而 没有 任何 数据 。 


你 可 能 已 留意 到 ， 这 里 还 用 了 --verbose 选项 。 它 会 使 mysqtdump 显示 出 备份 过 程 中 的 每 
个 主要 步 又。 在 我 们 的 环境 中 执行 该 命令 ， 会 出 现 如 下 结果 : 


-- Connecting to LocaLhost. . . 

-- Retrieving table structure for table bird families... 
-- Sending SELECT query... 

-- Retrieving rows... 

-- Retrieving table structure for table bird images... 


















































































































































EEC from LocaLhost. . . 
这 些 信息 有 时 候 会 很 有 用 ， 尤 其 是 在 出 错时 ， 它 们 能 让 你 知道 哪些 表 备份 成 功 了 ， 以 及 什 
么 时 候 出 现 了 问题 。 
如 果 是 备份 多 个 数据 库 ， 则 在 --databases 后 ， 将 它们 的 名 字 以 空格 分 隔 列 出 (可 能 你 会 
以 为 是 用 逗号 分 隔 ， 但 确实 不 是 )。 如 下 语句 将 备份 rookery 和 birdwatchers 数据 库 : 


mysqldump --user=admin_backup --password --lock-tables \ 
--databases rookery birdwatchers > rookery-birdwatchers.sgql 















































此 命令 会 将 rookery 和 birdwatchers 备份 到 rookery-birdwatchers.sql 这 个 文件 中 。 因 为 这 
两 个 数据 库 相 互 关联 ， 而 又 与 其 他 数据 库 无 关 ， 所 以 这 是 不 错 的 做 法 。 我 们 可 以 将 此 命令 
放 到 crontab 或 其 他 调度 工具 中 ， 使 这 两 个 数据 库 能 每 天 都 自动 备份 。 不 过 ， 这 样 的 话 ， 
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每 天 的 dump 文件 都 会 被 覆盖 一 次 。 如 果 我 们 误 删 了 数据 ， 并 在 几 天 后 才 发 现 ， 那 就 不 能 
从 备份 中 恢复 数据 了 。 考 虑 到 这 种 情况 ， 我 们 需要 每 天 都 用 一 个 不 同 的 文件 名 来 创建 备 
份 。 而 如 果 不 想 每 次 都 亲自 起 名 字 ， 可 以 用 shell 脚本 来 实现 。 


14.1.4 创建 备份 脚本 


若 想 自动 化 备份 ， 可 以 编写 脚本 ， 使 mysqldump 按 自己 的 设置 被 执行 。 这 并 不 复杂 。 如 果 
你 的 要 求 很 简单 ， 例 如 只 是 让 每 次 备份 的 结果 略微 不 同 ， 那 不 需要 有 多 高 的 编程 技巧 也 能 
做 到 。 


我 们 用 上 一 小 节 末 尾 的 那个 问题 ， 作 为 备份 脚本 的 例子 。 要 解决 该 问题 ， 可 以 在 dump 文 
件 的 名 称 中 加 上 日 期 ， 这 样 便 可 以 每 天 都 有 一 份 独立 的 dump 文件 了 。 具 体 做 法 ， 可 使 用 
以 下 这 个 简单 的 shell 脚本 ， 它 在 Linux 和 Mac 系统 上 都 能 运行 : 

#1!/bin/sh 









































my_user='admin_back’ 
my_pwd='my_silly_password' 


db1='rookery’ 
db2='birdwatchers' 
date_today=$ (date +%Y-%m-%d) 


backup_dir='/data/backup/ 
dump_file=$db1-$db2-$date_today' .sqL' 


/usr/bin/mysqldump --user=$my_uysr --password=$my_pwd --lock-tables \ 
--databases $db1 $db2 > $backup_dirsdump_file 


exit 


此 脚本 在 执行 mysqldump 时 所 带 的 选项 ， 与 之 前 的 例子 一 样 。 首 先 ， 设 定 变量 的 用 户 
名 、 密 码 和 数据 库 名 。 然 后 ， 用 date 命令 获取 年 月 日 的 数字 值 (以 横 杠 连接 )， 存 到 变量 
date_today 中 。dump 文件 的 名 字 则 是 用 数据 库 名 ($db1、$db2) 和 $date_today 拼接 而 成 
(结果 大 概 会 是 rookery-birdwatchers-2014-10-25.sql 这 样 ) 。 最 后 ， 用 所 有 这 些 变量 拼接 出 
我 们 要 执行 的 完整 的 mysqldump。 


因为 用 户 名 和 密码 都 写 在 脚本 里 ， 所 以 可 以 用 cron 来 让 它 每 天 自动 地 执行 ， 而 无 需 再 手动 
发 起 。 它 可 以 每 天 都 创建 一 个 新 的 dump 文件 ， 绝 不 覆盖 旧 的 dump 文件 。 但 是 ， 它 仍 有 
一 些 不 足 。 例 如 ， 它 不 具备 容错 能 力 。 当 备份 失败 时 ， 它 不 会 通知 任何 人 。 田 外 ， 它 也 不 
会 检查 备份 是 否 积压 太 多 。 一 般 来 说 ， 好 的 备份 脚本 应 该 能 做 到 定期 清理 旧 备 份 。 当 然 ， 
让 脚本 自动 清理 文件 会 有 些 麻烦 。 这 里 的 例子 只 为 给 你 提供 创建 备份 脚本 的 基本 思路 。 你 
所 要 创建 和 使 用 的 备份 脚本 应 该 更 加 复杂 ， 并 需要 处 理 错误 或 产生 报表 等 各 种 功能 。 


14.1.5 备份 指定 的 表 
对 于 那些 繁忙 的 大 型 数据 库 来 说 ， 你 可 能 不 想 一 次 就 备份 整个 数据 库 ， 而 想 逐 个 备份 表 。 

































































数据 库 的 备份 与 恢复 | 221 





你 可 能 每 周 备份 一 次 整个 数据 库 ， 然 后 每 日 备份 某 些 经 常 有 数据 改动 的 表 。 对 于 大 部 分 数 
据 库 来 说 ， 都 应 该 采取 这 种 谨慎 的 做 法 。 


以 我 们 的 两 个 数据 库 为 例 。rookery 数据 库 的 数据 不 常 更 新 : 我 们 不 可 能 天 天 都 会 发 现 新 
的 鸟 种 ， 同 理 ， 鸟 科 和 鸟 目 也 是 如 此 。 一 旦 每 种 鸟 的 所 有 详细 信息 都 确定 下 来 ， 它 们 就 基 
本 上 不 会 改变 。 而 birdwatchers 数据 库 则 不 是 这 样 。 如 果 我 们 的 网 站 很 繁忙 ， 那 么 该 数据 
库 的 所 有 表 就 会 经 常 有 新 增 和 修改 ， 所 以 ， 我 们 希望 每 天 都 备份 一 次 。 一 个 合理 的 做 法 就 
是 ， 每 周 备 份 一 次 rookery， 每 天 备份 一 次 btrdwatchers。 


再 假设 我 们 的 老板 十 分 担心 丢失 会 员 录 入 的 数据 。 他 要 求 我 们 每 天 都 做 两 次 humans 表 的 备 
份 (中 午 和 深夜 各 一 次 )。 我 们 当然 可 以 像 上 一 小 节 那 样 写 个 脚本 ， 在 生成 文件 名 时 ， 加 
上 midday (中 午 ) 和 midnight (深夜 )， 比 如 birdwatchers-humans-2014-09-14-midday.sql 
和 birdwatchers-humans-2014-09-14-midnight.sql。 而 唯一 需要 改变 的 是 ， 让 mysqLdump 只 备 
份 humans 一 个 表 。 试 着 执行 下 面 的 命令 : 


mysqldump --user=admin_backup --password --lock-tables \ 
--databases birdwatchers --tables humans > birdwatchers-hunmans.sgl 


与 之 前 不 同 的 是 ， 这 里 加 了 --tables 选项 ， 并 带 上 了 表 名 。 如 有 果 想 备份 同一 个 数据 库 中 
的 多 个 表 ， 只 需 在 --tables 后 ， 以 空格 分 隔 的 方式 ， 列 出 这 些 表 即 可 。 其 实 以 上 命令 不 
用 这 么 长 。 因 为 只 备份 一 个 数据 库 中 的 表 ， 所 以 --databases 是 不 需要 的 。 另 外 ， 因 为 
mysqtdump 能 把 数据 库 名 后 的 非 保 留 字 都 当成 表 名 ， 所 以 --tables 也 是 不 需要 的 。 这 样 ， 
上 例 的 命令 可 以 写成 这 样 : 
mysqldump --user=admin_backup --password --lock-tables \ 
birdwatchers humans > birdwatchers-humans.sql 


虽然 这 样 写 更 简短 ， 但 之 前 那 种 写法 更 易于 看 出 哪个 是 数据 库 名 ， 而 哪个 是 表 名 。 

现在 ， 党 试 增加 一 个 表 ， 不 过 是 男 一 个 数据 库 中 的 表 。 假 设 老板 说 rookery 中 的 birds 表 
也 要 备份 。 不 过 ，mysqldump 不 能 在 有 --tables 的 情况 下 带 两 个 数据 库 ， 我 们 只 能 为 两 个 
数据 库 分 别 执行 一 次 mysqtldump， 而 这 将 会 生成 两 个 dump 文件 。 如 果 想 让 一 个 dump 文件 
包含 两 个 表 ， 可 以 这 样 做 : 


mysqldump --user=admin_backup --password --lock-tables \ 
--databases rookery --tables birds > birds-hunmans.sql 


















































































































































mysqldump --user=admin_backup --password --lock-tables \ 
--databases birdwatchers --tables humans >> birds-humans.sgl 


此 处 我 们 运行 了 两 次 nysqLdump， 但 第 二 次 用 的 是 重 定向 追加 符号 (>>)， 令 输出 的 内 容 位 
于 同一 个 dump 文件 的 末尾 ， 而 不 是 创建 一 个 新 的 dump 文件 。 这 样 ，dump 文件 的 中 间 就 
会 有 一 个 注释 ， 说 这 一 次 dump 结束 了 ， 接 着 另 一 个 注释 说 第 二 次 dump 开始 。 不 过 因为 
它们 都 是 注释 ， 所 以 是 无 关 紧 要 的 。 另 外 ， 因 为 每 次 dump 的 变量 设置 都 会 在 结束 时 恢复 ， 
所 以 前 面 的 dump 不 会 影响 后 面 的 dump。 简 单 地 说 ， 这 样 追加 dump 是 没有 问题 的 。 
mysqldump 是 易 用 而 又 强大 的 工具 。 虽 然 我 们 已 经 介绍 了 它 的 很 多 选项 ， 但 其 实 它 还 有 更 
多 可 以 继续 挖掘 的 选项 。 详 情 可 以 参考 MySQL 和 MariaDB 的 网 站 ， 或 者 我 的 另 一 本 书 
《MySQL 核心 技术 手册 》 (http://shop.oreilly.com/product/9780596514334.d0)。 
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而 在 用 dump 文件 做 恢复 时 需要 很 小 心 ， 否 则 有 可 能 会 破坏 数据 库 。 因 此 ， 应 该 多 在 测试 
数据 库 或 测试 服务 器 上 练习 恢复 dump 文件 ， 以 使 自己 对 备份 和 恢复 得 心 应 手 。 不 然 ， 等 
到 丢失 数据 时 ， 你 只 能 硅 夺 碰 碰 地 去 做 恢复 ， 这 样 可 能 会 造成 无 法 挽回 的 错误 ， 或 那 时 才 
发 现 原来 数据 都 没有 备份 好 。 所 以 ， 还 是 准备 好 练习 环境 ， 踏 实地 和 掌握 这 些 技能 吧 。 下 一 
市 就 来 讲 讲 如 何 用 备份 文件 恢复 数据 。 


14.2 恢复 备份 


如 果 你 的 MySQL 丢 了 数据 ， 而 你 一 直 在 用 mysqldump 定期 备份 数据 ， 那 么 就 可 以 通过 这 
些 dump 文件 来 做 恢复 。 毕 竞 ， 备 份 文 件 的 目的 正在 于 此 。 只 需 用 mysql 客户 端 执行 dump 
文件 中 的 所 有 语句 ， 就 可 以 恢复 用 mysqtdump 备份 的 dump 文件 。 可 以 恢复 所 有 数据 库 、 
单个 数据 库 、 某 些 表 ， 甚 至 某 些 行 。 我 们 会 在 本 节 讲 解 这 些 内 容 。 


14.2.1 恢复 数据 库 
先 来 看 看 如 何 恢复 整个 数据 库 。 为 了 安全 起 见 ， 作 为 实验 过 程 的 一 部 分 ， 我 们 给 rookery 
做 一 次 新 的 备份 ， 然 后 恢复 它 。 执 行 以 下 命令 : 
mysqldump --user=admin_backup --password --lock-tables \ 
--databases rookery > rookery.sql 


恢复 前 ， 先 检查 dump 文件 是 否 有 该 有 的 语句 。 如 果 正 常 ， 那 就 删 掉 rookery 数据 库 。 虽 
然 这 听 起 来 很 可 怕 ， 但 不 用 担心 ， 我 们 已 做 好 备份 。 数 据 库 崩溃 或 被 意外 删除 是 有 可 能 发 
生 的 。 所 以 ， 我 们 应 提前 在 rookery 这 种 测试 数据 库 上 演习 一 下 ， 以 建立 信心 。 下 面 就 来 
删除 这 个 数据 库 : 


mysql --user=admin_restore --password --execute "DROP DATABASE rookery;" 


这 里 的 做 法 是 ， 在 命令 行 中 用 mysql 执行 DROP DATABASE 语句 (当然 ， 登 录 mysql 客户 端 
再 执行 DROP DATABASE 也 可 以 ) ， 这 需要 用 到 - -execute 选项 。 另 外 ， 你 也 需要 指定 一 个 有 
删除 数据 库 权 限 的 管理 员 。 而 这 里 就 用 了 上 一 章 建 的 admin_restore。 删 完 之 后 ， 可 用 SHOW 
DATABASES 确认 rookery 是 否 真 的 已 被 删除 。 
接着 ， 我 们 就 可 以 开始 恢复 rookery 了 : 

mysql --User=admin_restore --password < rookery.sgl 
以 上 是 在 命令 行 中 用 mysql 执行 rookery.sql 里 的 语句 。 注 意 ， 小 于 号 (<) 使 标准 输入 
(STDIN) 重 定向 到 该 文件 ， 然 后 mysql 便 会 抽取 文件 的 内 容 并 执行 。 最 终 ， 这 条 命令 会 创 
建 rookery 数据 库 及 其 所 含 的 表 ， 并 往 表 中 插入 原本 所 有 的 数据 。 你 可 以 在 做 完 之 后 ， 登 
录 MySQL， 切换 到 rookery， 用 SHOW TABLES 查看 表 的 情况 ， 并 用 SELECT 看 看 数据 是 否 都 
已 恢复 。 这 样 练 手 是 很 必要 的 ， 而 且 也 能 让 你 对 恢复 整个 数据 库 更 有 自信 。 


14.2.2 ”恢复 表 


用 dump 文件 恢复 整个 数据 库 ， 会 带 来 一 个 问题 : 可 能 会 覆 写 了 不 相关 的 表 。 例 如 ， 假 设 
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你 不 小 心 删 掉 了 某 个 表 ， 然 后 想 恢复 它 。 这 时 ， 该 表 所 属 数据 库 的 其 他 表 是 正常 的 。 如 果 
最 新 的 dump 文件 是 在 几 个 小 时 前 生成 的 ， 但 在 这 期 间 ， 其 他 表 的 数据 有 改动 。 如 果 用 这 
个 dump 文件 来 恢复 整个 数据 库 ， 那 么 其 他 表 的 新 增 和 修改 的 记录 就 会 丢失 。 我 想 你 应 该 
不 希望 这 种 事 发 生 吧 。 而 如 果 每 个 表 都 分 开 备份 ， 那 恢复 一 个 表 就 会 很 简单 。 不 过 ， 要 维 
护 一 大 堆 dump 文件 又 会 很 麻烦 。 好 在 我 们 还 有 一 些 方法 ， 可 以 在 使 用 整个 数据 库 的 dump 
文件 时 ， 限 制 只 恢复 单个 表 。 下 面 就 来 看 看 这 些 方法 。 

1. 修改 dump 文 件 

我 们 在 14.1.2 节 中 已 看 到 ， 数 据 库 的 dump 文件 是 含有 SQL 语句 的 简单 文本 文件 ， 这 些 语 
名 可 以 用 于 创建 数据 库 ， 然 后 分 别 恢复 每 个 表 及 其 数据 。 用 数据 库 的 dump 文件 恢复 一 个 
表 的 方法 ， 就 是 修改 dump 文件 。 你 可 以 将 无 关 的 语 名 去掉， 只 留 下 你 要 恢复 的 表 的 相关 
语句 。 


假设 你 有 一 个 dump 文件 ， 里 面 只 包含 rookery 数据 库 ， 而 你 因为 不 小 心 删 掉 或 修改 了 
部 分 数据 ， 需 要 恢复 conservation_status 表 。 可 以 复制 一 份 rookery.sql， 然 后 用 普通 的 
文本 编辑 器 打开 它 ， 删 掉 创 建 其 他 表 的 部 分 ， 只 保留 临时 变量 的 设置 和 恢复 语句 ， 以 及 
conservation_status 的 部 分 。 又 或 者 ， 直 接 打 开 原 本 的 rookery.sql， 只 将 需要 的 语句 复制 
出 来 ， 粘 到 新 的 文本 文件 中 。 通 过 这 些 方法 得 到 的 新 dump 文件 都 应 该 是 一 样 的 ， 你 可 以 
用 它 来 恢复 表 。 

以 下 是 经 过 截取 的 dump 文件 : 


- MySQL dump 10.14 Distrib 5.5.39-MariaDB, for Linux (1686) 







































































- Host: LocaLhost “Database: rookery 


- Server version 5.5.39-MariaDB 


/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */; 

/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */; 

/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */; 

/*!40101 SET NAMES utf8 */; 

/*!40103 SET @OLD_TIME_ ZONE=@@TIME_ ZONE */; 

/*!40103 SET TIME_ ZONE='+00:00' */; 

/*!40014 SET @OLD_UNIQUE CHECKS=@@UNIQUE_ CHECKS, UNIQUE_ CHECKS=0 */; 

/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS,FOREIGN_KEY...=0*/; 
/*!40101 SET @OLD_SQL MODE=@@SQL MODE, SQL_ MODE='NO_AUTO_VALUE_ON_ZERO' */; 
/*!40111 SET @OLD_SQL NOTES=@@SQL NOTES, SQL NOTES=0 */; 


- Current Database: ‘rookery. 


CREATE DATABASE /*!32312 IF NOT EXISTS*/ ‘rookery. 
/*!40100 DEFAULT CHARACTER SET latin1 COLLATE latin1_ bin */; 
USE “rookery ; 


-一 [snip ] 





-- Table structure for table “conservation_status 


DROP TABLE IF EXISTS “Conservation_status ; 
/*!40101 SET @saved_cs_client = @@character_set client */; 
/*!40101 SET character_set _ client = utf8 */; 


CREATE TABLE “conservation status. ( 
“conservation_status_id. int(11) NOT NULL AUTO_INCREMENT, 
‘conservation_category char(10) COLLATE Latin1_bin DEFAULT NULL， 
‘conservation_state. char(25) COLLATE Latin1_bin DEFAULT NULL， 
PRIMARY KEY (`conservation_status id `) 

) ENGINE=MyISAM AUTO_INCREMENT=10 
DEFAULT CHARSET=Latin1 COLLATE=latin1_bin; 

/*!40101 SET character_set_CLient = @saved_cs_client */; 


-- Dumping data for table ‘conservation_status. 


LOCK TABLES ‘conservation_status” WRITE; 
/*!40000 ALTER TABLE “conservation_status ”DISABLE KEYS */; 


INSERT INTO “conservatiton_status ”VALUES 
(1,'Extinct','Extinct'), 
(2,'Extinct','Extinct in Wild'), 
(3,'Threatened','Critically Endangered'), 
(4,'Threatened','Endangered'), 
(5,'Threatened','Vulnerable'), 

(6,'Lower Risk','Conservation Dependent'), 
(7,'Lower Risk','Near Threatened'), 
(8,'Lower Risk','Least Concern'), 
(9,NULL，Unknown ' ); 

/*!40000 ALTER TABLE “Conservation_status ”ENABLE KEYS */; 


UNLOCK TABLES; 


-- [ snip ] 


/*!140103 SET TIME_ ZONE=@OLD_TIME_ZONE */; 


/*!40101 SET SQL_ MODE=@OLD_SQL MODE */; 

/*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */; 
/*!140014 SET UNIQUE CHECKS=@OLD UNIQUE CHECKS */; 

/*!40101 SET CHARACTER_ SET_CLIENT=@OLD_CHARACTER_SET_CLIENT */; 
/*!40101 SET CHARACTER_ SET_RESULTS=@OLD_CHARACTER_SET_RESULTS */; 
/*!40101 SET COLLATION CONNECTION=@OLD_COLLATION_CONNECTION */; 
/*!40111 SET SQL_NOTES=@OLD SQL_NOTES */; 


-- Dump completed on 2014-09-15 6:48:27 


这 个 dump 文件 会 恢复 conservation_status 表 。 我 用 [ snip ] 加 了 几 个 注释 ， 
了 原 dump 文件 的 什么 内 容 。 另 外 ， 为 了 适应 页 面 的 宽度 ， 我 还 加 了 一 些 回 车 。 
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的 话 ， 该 文件 看 起 来 应 该 与 备份 conservation_status 所 产生 的 dump 文件 一 样 。 

这 样 做 是 可 以 的 ， 只 是 比较 无 聊 ， 而 且 你 有 可 能 截 多 或 截 少 了 某 些 语句 。 接 下 来 我 再 介绍 
恢复 单个 表 的 其 他 方法 。 

2. 用 临时 数据 库 来 做 恢复 

另 一 个 恢复 单个 表 的 方法 ， 就 是 修改 dump 文件 中 的 数据 库 名 。dump 文件 一 般 包 含 一 条 
CREATE DATABASE 语句 。 如 果 把 数据 库 名 换 成 服务 器 上 没有 使 用 的 名 字 ， 这 样 一 旦 执行 该 
dump 文件 ， 就 会 创建 一 个 新 的 数据 库 ， 而 所 有 表 和 数据 都 会 恢复 到 该 数据 库 中 。 接 下 来 ， 
可 以 将 需要 的 表 从 这 个 临时 数据 库 复 制 到 原 数 据 库 中 。 做 完 之 后 ， 可 以 删 掉 临 时 数据 库 。 
下 面 来 看 例子 。 
回 到 刚才 的 例子 ， 假 设 你 的 dump 文件 中 有 整个 rookery 数据 库 ， 但 你 只 想 恢复 其 中 的 
conservation_status 表 。 如 果 你 现在 没有 rookery 的 dump 文件 ， 那 就 用 mysqLdump 创建 
一 个 ， 这 样 便 可 以 跟着 我 一 起 做 了 。 

首先 ， 用 SHOW DATABASES 看 看 服务 右上 现存 些 什么 数据 库 ， 以 免 临 时 数据 库 重 名 。 接 着 ， 
在 文本 编辑 器 中 打开 dump 文件 ， 找 到 开头 的 CREATE DATABASE 语句 附近 的 行 。 编 辑 这 一 部 













































































-- Current Database: “rookery 


CREATE DATABASE /*!32312 IF NOT EXISTS*/ ‘rookery backup. 
/*!40100 DEFAULT CHARACTER SET Latin1 COLLATE latini1_bin */; 


USE “rookery_pacKkup  ; 


可 以 看 到 ， 我 把 CREATE DATABASE 和 USE 这 两 处 的 rookery 改 成 了 rookery_backup。 确 实 ， 
要 改 的 只 有 这 两 处 。 现 在 保存 该 dump 文件 并 执行 。 使 用 一 个 具备 CREATE 权限 的 管理 员 账 
号 ， 输 入 以 下 命令 : 

mysql --User=admin_restore --password < rookery.sql 
执行 过 后 ， 服 务 器 上 应 该 就 多 了 rookery_backup 数据 库 。 现 在 ， 只 要 通过 mysql 客户 端 登 
录 MySQL， 设 rookery_backup 为 默认 数据 库 ， 然 后 运行 SHOW TABLES 和 几 个 SELECT 语句 ， 
就 会 看 到 rookery 的 表 和 数据 全 都 出 现在 这 里 了 。 现 在 就 可 以 恢复 需要 的 那个 表 了 。 
恢复 表 有 两 种 方法 。 我 们 两 种 都 试 一 下 。 首 先 ， 删 折 rookery 的 conservation_status 表 。 
为 此 ， 你 需要 执行 以 下 命令 : 


DROP TABLE rookery.conservation_status; 


在 rookery 中 新 建 一 个 conservation_status 表 。 你 可 以 在 备份 副本 上 做 ， 这 会 用 到 CREATE 
TABLE.… .LIKE (我 们 在 5.3.3 节 中 介绍 过 )。 输 入 以 下 命令 : 


CREATE TABLE rookery.conservation_status 
LIKE rookery_backup.conservation_status; 
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接着 ， 从 备份 表 中 将 数据 复制 到 新 建 的 表 中 : 

INSERT INTO rookery.conservation_status 

SELECT * FROM rookery_backup.conservation_status; 
INSERT. . .SELECT 在 6.3.2 节 中 提 到 过 。 它 会 把 rookery_backup.conservation_status 里 的 
所 有 行 都 复制 到 rookery.conservation_status 里 。 执 行 过 后 ， 可 以 再 用 一 个 SELECT 检查 
rookery.conservation_status 是 否 已 有 数据 。 一 切 顺利 的 话 ， 就 可 以 删 掉 临时 数据 库 了 : 


DROP DATABASE rookery_backup; 


这 种 方法 是 可 行 的 。 不 过 ， 如 果 数 据 库 很 大 ， 那 么 临时 导入 整个 数据 库 就 会 很 花 时 间 。 但 
话说 回来 ， 若 真有 这 么 大 的 数据 库 ， 那 就 应 该 分 开 备 份 表 ， 这 样 才 容易 管理 。 采 用 这 种 做 
法 ， 需 要 有 CREATE 和 DROP 权限 来 创建 和 删除 数据 库 。 


如 有 果 不 想 修改 dump 文件 ， 可 以 试 试 下 面 介绍 的 方法 。 


3. 使 用 受 限 的 用 户 账号 

恢复 单个 表 有 一 个 很 简单 的 方法 ， 就 是 创建 一 个 临时 用 户 账号 ， 使 其 只 在 要 恢复 的 表 上 有 
操作 权限 。 这 样 ， 当 用 这 个 账号 来 运行 dump 文件 时 ， 用 于 其 他 表 的 语句 就 会 执行 失败 ， 
而 上 只 有 授权 过 的 表 才 会 被 恢复 。 要 建 这 样 的 账号 ， 需 要 有 GRANT OPTION 权限 〈 例 如 root 就 
有 )。 下 面 继续 用 之 前 的 例子 (只 恢复 conservation_status 表 )， 来 看 看 这 种 方法 的 具体 
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其 实 这 种 方法 有 点 危险 。 如 果 不 清楚 给 这 个 账号 哪些 权限 ,或 者 用 root 而 不 
是 受 限 的 用 户 账号 不 小 心 从 dump 文件 中 恢复 数据 ， 那 么 就 有 可 能 会 覆盖 所 
有 备份 到 dump 文件 中 的 数据 库 。 所 以 ， 要 很 小 心 。 








为 了 更 好 地 看 出 此 法 的 妙 效 ， 我 们 在 恢复 数据 之 前 除了 要 删 掉 conservation_status 表 ， 
还 要 改动 一 下 其 他 表 的 数据 ， 以 验证 恢复 后 这 些 改动 是 否 还 存在 。 我 们 用 第 13 章 创建 的 
admin_boss 来 做 : 














mysql --user=admin_boss --password \ 
--execute "DROP TABLE rookery.conservation_status; 
INSERT INTO rookery.birds (common_name,description) 
VALUES('Big Bird','Large yellow bird found in New York'); 


SELECT LAST_INSERT_ID();" 
以 上 语句 应 该 能 删 掉 conservation_status。 而 为 了 验证 恢复 会 不 会 影响 到 conservation_ 
status 以 外 的 其 他 表 ， 我 们 在 birds 表 中 新 增 了 一 行 ， 并 用 最 后 一 名 SELECT LAST_ 
INSERT_ID() 查 回 该 行 的 ID。 你 甚至 可 以 登录 MySQL， 检 查 是 否 真 的 删 掉 了 
conservation_status， 并 用 刚才 的 ID 查 查 birds 是 否 真 的 新 增 了 一 行 。 如 果 没 问题 的 
话 ， 就 可 以 继续 了 。 
现在 ,创建 受 限 的 管理 员 账号 admin_restore_temp。 输 入 GRANT 语句 : 


GRANT SELECT 
ON rookery.* TO ‘admin_restore_tenmp'@'localhost' 
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IDENTIFIED BY 'its_pwd ' ; 


GRANT ALL ON rookery.conservation_status 
TO ‘admin_restore_tenmp'@' localhost'; 


这 先 使 admin_restore_temp 在 rookery 所 有 表 上 有 SELECT 权限 ， 而 后 再 让 它 单独 在 
conservation_status 表 上 有 ALL 权限。 于 是 ， 当 你 恢复 包含 rookery 所 有 表 的 dump 文件 
时 (使 用 admin_restore_temp)， 便 只 有 conservation_status 会 被 禁 换 。 


当 用 这 个 用 户 账号 执行 dump 文件 时 ， 因 为 无 权 操 作 其 他 表 ， 所 以 如 果 它 想 赫 换 其 他 
表 ，MySQL 就 会 报错 。 正 常 来 说 ，dump 文件 的 运行 会 终止 。 为 了 能 顺利 进行 ， 可 以 用 
--force 选项 来 忽略 报错 信息 。 


现在 ,使 用 以 下 命令 恢复 表 : 
mysql --user admin_restore_temp --password --force < rookery.sgl 


这 应 该 没有 问题 。 请 自行 登录 MySQL， 并 检查 conservation_status 是 否 已 恢复 。 然 后 ， 
用 SELECT 检查 birds 表 新 增 的 Big Bird 是 否 还 在 。 如 果 在 ， 那 表示 在 恢复 dump 文件 时 没 
有 禾 盖 birds 表 ， 而 其 他 表 也 应 该 没 受 影响 。 


14.2.3 ”只 恢复 某 些 行 或 列 

一 般 来 说 ， 恢 复 整 个 数据 库 或 整个 表 是 很 少见 的 。 我 们 很 少 会 误 删 整个 数据 库 或 整个 表 ， 
或 一 下 子 改 错 了 表 中 的 所 有 行 。 更 多 的 情况 是 ， 有 人 误 删 了 表 中 的 某 行 或 误 改 了 某 列 ， 却 
无 法 撤销 操作 。 如 果 其 他 行 的 改动 无 误 ， 而 你 只 有 这 些 改动 前 的 备份 ， 那 么 用 这 个 备份 来 
恢复 整个 表 就 因 小 失 大 了 。 这 时 候 ， 应 该 只 恢复 某 一 行 或 某 一 列 。 


这 可 以 通过 上 一 节 介 绍 的 临时 数据 库 来 做 恢复 。 上 一 节 介绍 了 如 何 修改 rookery 数据 库 的 
dump 文件 ， 这 样 MySQL 就 能 把 这 个 数据 库 导入 新 的 临时 数据 库 (rookery_backup)。 如 
果 用 这 种 方法 ， 就 能 用 带 WHERE 的 INSERT.. .SELECT， 只 选取 要 恢复 的 行 。 下 面 我 们 就 来 
试 试 。 

假设 有 人 不 小 心 删 掉 了 birdwatchers 数据 库 的 humans 表 的 一 条 会 员 记 录 (Lexi Hollar)， 
并 清空 了 另 一 个 会 员 (Nina Smirnova) 的 邮件 地 址 。 为 了 模拟 这 个 情境 ， 我 们 先 做 一 个 
birdwatchers 的 备份 ， 然 后 再 删 掉 上 述 两 条 记录 ; 


mysqldump --user=admin_backup --password --lock-tables \ 
--databases birdwatchers > birdwatchers.sgl 



































































































































mysql --user=admin_restore --password \ 
--execute "DELETE FROM birdwatchers.humans 
WHERE name_first = "Lexi' 
AND name_last = 'Hollar'; 


UPDATE birdwatchers.humans 
SET email_address="" 

WHERE name_first = "Nina' 
AND name_last = 'Smirnova'" 








执行 以 后 ， 登 录 MYSQL， 确 认 是 否 在 humans 表 中 删 掉 了 Lexi Hollar 这 个 名 字 和 Nina 
Smirnova 的 邮件 地 址 。 尽 管 你 对 这 些 改动 很 确信 ， 还 是 应 该 确认 一 下 。 完 成 这 些 过 程 对 你 
是 有 益 的 ， 这 会 让 你 在 后 面 的 恢复 工作 中 更 有 信心 。 

接着 ， 把 birdwatchers 数据 库 导 入 临时 数据 库 。 编 辑 刚 创 建 的 birdwatchers.sql， 并 查 
找 与 该 数据 库 相 关 的 SQL 语句 ， 应 该 只 有 CREATE DATABASE 和 USE。 把 数据 库 名 改 成 
birdwatchers_backup (假设 服务 器 上 没有 这 样 的 数据 库 名 )。 保 存 dump 文件 并 退出 。 用 以 
下 命令 导入 这 个 dump 文件 : 


mysql --user=admin_restore --password < birdwatchers.sgl 





























执行 以 后 ， 登 录 MySQL， 用 SHOW DATABASES 看 看 birdwatchers_backup 是 否 已 创建 。 如 果 
建 好 了 ， 就 用 以 下 命令 来 恢复 humans 表 中 的 数据 : 
REPLACE INTO birdwatchers.humans 


SELECT * FROM birdwatchers_backup.humans 
WHERE name_first = 'Lexi' AND name_Last = 'HoLLar '; 


UPDATE birdwatchers.humans 
SET email_address = 'beLLa.ninagmaiL.ru' 
WHERE name_first = 'Nina' AND name_Last = 'Smirnova'; 


这 就 恢复 了 Lexi Hollar 的 整 条 记录 ， 以 及 Nina Smirnova 的 邮件 地 址 ， 而 且 对 数据 库 中 
的 其 他 行 或 表 毫 发 无 伤 。 注 意 ， 这 里 用 了 REPLACE， 而 不 是 INSERT。 如 果 MySQL 找到 了 
和 WHERE 子 名 匹配 的 行 ， 并 且 其 human_id 又 相同 ， 那 备份 表 里 匹配 的 行 就 会 替换 掉 该 行 ， 
否则 ， 就 会 插入 备份 新 的 一 行 。 无 论 怎 么 做 ， 恢 复 后 的 human_id 都 是 原本 的 human_id。 
这 意味 着 参考 那 一 行 的 其 他 表 都 会 有 正确 的 human_id。 顺 便 说 一 下 ， 给 mysqldump 加 上 
--replace 选项 ， 就 可 以 使 生成 的 dump 文件 不 用 INSERT， 而 用 REPLACE。 


恢复 完 后 ， 用 DROP DATABASES 删除 btrdwatchers_backup 数据 库 。 


这 个 方法 很 适用 于 恢复 某 些 行 或 列 ， 特 别 是 在 你 只 想 修复 某 个 人 的 误 操 作 ， 而 又 不 想 影响 
到 其 他 人 的 时 候 。 它 十 分 简单 ， 通 常 不 会 花费 太 多 时 间 。 你 可 以 在 WHERE 中 加 上 各 种 各 样 
的 条 件 ， 以 限定 恢复 的 范围 。 如 果 你 想 成 为 优秀 的 数据 库 管 理 员 ， 那 就 要 好 好 掌握 这 一 技 
能 。 当 你 可 以 毫 不 费劲 地 恢复 数据 库 时 ， 用 户 会 非常 综 拜 你 。 


14.2.4 用 二 进 制 日 志 来 做 恢复 

前 几 节 介绍 的 恢复 方法 大 多 是 常用 方法 。 有 时 你 需要 更 精确 的 方法 ， 如 前 面 讲 到 的 恢复 单 
行 和 单列 。 当 你 恢复 指定 的 行 时 ， 就 会 用 到 这 个 方法 ， 而 丢失 的 数据 保存 在 dump 文件 中 。 
然而 ,假设 你 要 恢复 的 是 备份 后 才 发 生 的 数据 改动 ， 可 能 很 多 人 都 会 觉得 做 不 到 。 其 实 ， 
只 要 你 理解 MySQL 的 二 进 制 日 志 ， 并 足够 谨慎 便 可 办 到 。 可 以 用 二 进 制 日 志 来 将 数据 恢 
复 到 指定 的 时 间 点 (这些 数 据 是 在 最 近 一 次 创建 dump 文件 时 产生 的 ) 。 这 种 做 法 被 称 为 时 
间 点 恢复 。 


时 间 点 恢复 的 前 提 条 件 是 ， 你 开启 了 二 进 制 日 志 。 如 果 等 到 出 问题 时 才 开启 ， 那 将 无 济 于 
事 。 想 知道 二 进 制 日 志 是 否 开 启 ， 可 以 用 以 下 命令 检查 : 
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SHOW BINARY LOGS; 

ERROR 1381 (HY000): You are not Using binary logging 
如 果 出 现 以 上 报错 信息 ， 就 需要 去 开局 二 进 制 日 志 。 
开启 二 进 制 日 志 可 能 会 有 安全 隐患 。 所 有 执行 过 的 、 修 改 数据 的 SQL 语句 都 
会 被 记录 在 二 进 制 日 志 中 ， 其 中 可 能 包括 一 些 敏感 数据 (如 信用 卡号 码 ) 和 
各 种 密码 。 因 此 ， 需 要 确保 不 是 人 人 都 能 访问 日 志文 件 及 其 所 在 目录 ， 并 


日 志 当 中 不 要 记录 含有 用 户 账号 密码 的 mysql 数据 库 的 相关 操作 。 如 要 排除 
日 志 中 的 某 些 数据 库 ， 可 以 用 --binlog-ignore-db 选项 指定 。 


















































开启 二 进 制 日 志 的 方法 如 下 : 修改 MySQL 配置 文件 (具体 看 你 的 是 什么 系统 ， 可 能 是 
my.cnf 或 my.ini) ， 在 [mysqLd] 那 一 部 分 中 ， 加 入 以 下 语句 : 


log-bin 

binlog-ignore-db=mysql 
注意 第 一 行 是 不 带 等 号 或 值 的 。 第 二 行 指示 MySQL 忽略 mysql 数据 库 的 改动 。 在 配置 文 
件 中 加 完 这 些 内 容 之 后 ， 记 得 重启 MySQL， 以 使 配置 生效 。 之 后 ， 再 次 登录 MySQL ， 检 
查 二 进 制 日 志 是 否 已 开启 。 这 次 ， 我 们 用 SHOW MASTER STATUS : 


SHOW MASTER STATUS; 




















+--------------------------- +---------- +-------------- +------------------ + 
| File | Position | Binlog Do DB | Binlog Ignore_DB | 
+--------------------------- +---------- +-------------- +------------------ + 
| mysqlresources-bin.000001 | 245 | | mysql | 
+--------------------------- +---------- +-------------- +------------------ 十 


它 显 示 了 当前 在 用 的 日 志文 件 的 名 字 ， 以 及 被 忽略 的 数据 库 。 


既然 MySQL 正在 记录 二 进 制 日 志 中 的 所 有 SQL 语句 ， 那 就 可 以 做 时 间 点 恢复 了 。 为 了 体 
验 这 个 过 程 ， 我 们 需要 登录 MySQL， 然 后 往 表 中 插入 大 量 数据 。 为 了 简单 起 见 ， 我 们 直 
接 使 用 MySQL 资源 站 (http://mysqlresources.com/files) 的 birds-simple.sql 和 birds-simple- 
transactions.sql。 前 者 会 在 rookery 数据 库 中 增加 含有 数据 的 birds_simple 表 。 后 者 会 先 往 
该 表 插 入 一 些 行 ， 然 后 通过 一 条 SQL 语句 修改 某 些 行 ， 以 模拟 误 改 数据 ， 最 后 再 插入 几 
行 。 而 我 们 要 做 的 练习 是 : 仅 恢 复 误 改 前 和 误 改 后 所 产生 的 行 。 如 果 你 要 跟着 我 做 ， 请 先 
下 载 那 两 份 dump 文件 ， 然 后 到 文件 所 在 目录 执行 以 下 命令 : 


mysql --user=admin_restore --password --database=rookery < birds-simple.sgql 





























mysql --user=root --password --silent \ 
--execute="SELECT COUNT(*) AS '' FROM rookery.birds_simple;" 


你 可 能 会 注意 到 ， 我 在 第 一 条 命令 中 加 了 - -database 选项 ， 把 它 设 置 为 rookery。 当 我 生 
成 dump 文件 时 ， 只 dump 了 birds_simple 表 。 结 果 ， 这 个 dump 文件 中 没有 USE， 而 且 
表 名 前 也 不 带 数据 库 名 。 所 以 ， 需 要 加 上 --database=rookery， 使 MySQL 在 rookery 数 
据 库 中 执行 dump 文件 中 的 所 有 语句 。 而 如 果 一 切 顺 利 ， 第 二 条 命令 应 该 会 告诉 你 birds_ 
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simple 表现 在 有 28 892 行 。 
接着 ， 用 birds-simple-transactions.sql 来 破坏 该 表 中 的 数据 (增加 和 删除 许多 行 ) : 


mysql --user=admin_restore --password \ 
--database=rookery < birds-simple-transactions.sgl 


mysql --user=root --password --silent \ 
--execute="SELECT COUNT(*) AS '' FROM rookery.birds_ simple;" 


birds-simple-transactions.sql 包含 了 带 WHERE 的 一 些 DELETE 语句 ， 用 来 删除 许多 行 。 它 还 有 
一 些 INSERT 语句 ， 用 来 新 增 一 些 行 。 最 后 结果 应 该 会 比 刚 才 少 了 296 行 。 
接 下 来 ， 我 们 准备 逐步 进行 时 间 点 恢复 。 为 了 把 所 有 数据 恢复 到 指定 的 时 间 点 ， 我 们 先 以 
最 近 一 次 备份 为 起 点 ， 即 birds-simple.sql: 

mysql --user=admin_restore --password \ 

--database=rookery < birds-simple.sql 

这 就 使 birds_simple 表 恢 复 到 生成 birds-simple.sql 的 那个 时 间 点 。 你 可 以 登录 MySQL， 
计算 birds_simple 表 的 行 数 。 现 在 应 该 是 28 892 行 了 。 
下 一 步 是 获取 此 状态 后 被 执行 过 的 SQL 语句 。 如 果 数 据 库 很 繁忙 ， 一 直 不 停 地 在 执行 
SQL 语句 ， 那 要 找 出 其 中 某 一 条 ， 可 能 会 稍微 麻烦 。 因 此 ， 如 果 想 结合 使 用 mysqtdump 和 
mysqlbinlog， 就 应 该 在 做 备份 时 用 mysqLdump 刷新 日 志 。 我 在 生成 birds-simple.sql 时 就 加 
了 --flush-logs 选项 。 现 在 我 们 需要 从 当前 日 志文 件 的 开头 ， 将 数据 恢复 到 执行 DELETE 
语句 的 那个 时 间 点 。 可 以 从 二 进 制 日 志 中 确定 那个 时 间 点 。 
接着 ， 只 需 用 mysqtbinlog 抽取 当前 二 进 制 日 志 的 内 容 并 将 其 保存 到 文本 文件 中 ， 就 能 
便 地 定位 哪些 语句 出 问题 了 。 
1. 翻 查 二 进 制 日 志 
翻 查 之 前 ， 你 得 先知 道 包含 SQL 语句 的 二 进 制 日 志 的 名 字 和 位 置 。 可 以 用 SHOW MASTER 
STATUS 来 查 名 字 ， 而 位 置 通常 是 在 data 目录 中 ， 具 体 可 以 用 SHOW VARIABLES 来 查 : 


SHOW MASTER STATUS; 









































+--------------------------- +---------- +-------------- +------------------ + 
| File | Position | Binlog Do DB | Binlog Ignore_DB | 
+--------------------------- +---------- +-------------- +------------------ 十 
| mysqlresources-bin.000002 | 7388360 | | mysql | 
4- +---------- +-------------- +------------------ + 


SHOW VARIABLES WHERE Variable_Name LIKE 'datadir'; 


+--- +-------------- + 
| Variable name | Value | 
+--- +-------------- 十 
| datadir | /data/mysql/ | 
+--- +-------------- 十 


第 一 条 语句 显示 当前 二 进 制 日 志文 件 的 名 字 是 mysqlresources-bin.000002。 之 所 以 名 字 中 改 





数据 库 的 备份 与 恢复 | 231 





成 了 2， 是 
日 志文 但 








F 放 在 /data/mysql/ 目录 中 〈 当 然 你 也 可 以 去 检查 一 下 它 是 否 真 的 在 那 








置 和 名 字 后 ， 就 可 以 用 以 下 命令 来 抽取 我 们 需要 的 内 容 了 : 


mysqlbinlog --database=rookery \ 


/data/mysql/mysqlresources-bin.000002 > recovery-research. txt 





里 








因为 我 做 birds-simple.sql 时 ， 加 上 了 --flush-logs。 至 于 第 二 条 语句 ， 则 显示 
) 


知道 位 


如 你 所 见 ， 我 用 了 - -database 选项 ， 限 定 mysqlbinlog 只 抽取 与 rookery 有 关 的 语句 。 否 


则 ， 抽 取 的 文件 就 会 包含 其 他 数据 库 的 活动 。 另 外 ， 











因为 在 我 的 服务 器 上 ， 数 据 库 多 达 


二 十 几 个 ， 其 中 某 些 还 被 频繁 地 存 取 ， 所 以 ， 为 了 使 恢复 过 程 更 简单 ， 以 及 避免 不 小 心 重 


TT 





其 他 数据 库 ， 我 就 作 了 这 样 的 限定 。 


接着 ， 只 需 指 定 二 进 制 日 志文 件 的 路 径 和 名 字 ， 以 及 重 定向 的 位 置 (> recovery- 
research.txt)， 即 可 将 mysqlbinlog 的 结果 导入 该 文件 。 
2. 从 二 进 制 日 志 中 抽取 语句 并 执行 

导出 完成 以 后 ， 用 文本 编辑 器 打开 该 文件 ， 查 找 DELETE 语句。 因为 我 们 只 做 过 两 次 DELETE 
操作 (我 已 截取 如 下 )， 所 以 恢复 起 来 应 该 很 简单 : 























# at 1258707 

#140916 13:10:24 server id 1 end_Log_pos 1258778 
Query thread_id=382 exec_time=0 error_code=0 

SET TIMESTAMP=1410887424/*!*/; 

SET @@session.sql_mode=0/*!*/; 


BEGIN 
/rs1 


# at 1258778 

#140916 13:10:24 server id 1 end_Log_pos 1258900 
Query thread_id=382 exec_time=0 error_code=0 

Use “rookery /*!*/; 

SET TIMESTAMP=1410887424/*!*/; 


DELETE FROM birds_simple WHERE Common_name LIKE '%Blue%' 
/xs 


# at 1258900 
#140916 13:10:24 server id 1 end_Log_pos 1258927 Xid = 45248 


COMMIT/*!*/; 


# at 1284668 

#140916 13:10:28 server id 1 end_Log_pos 1284739 
Query thread_ id=382 exec_ time=0 error_code=0 

SET TIMESTAMP=1410887428/*!*/; 

SET @@session.sql_mode=0/*!*/; 

BEGIN 

Ar 








# at 1284739 

#140916 13:10:28 server id 1 end_Log_pos 1284862 

Query thread_id=382 exec_time=0 error_code=0 

SET TIMESTAMP=1410887428/*!*/; 

DELETE FROM birds_simple WHERE Common_name LIKE “%Green% 
1 


# at 1284862 
#140916 13:10:28 server id 1 end_Log_pos 1284889 Xid = 45553 
COMMIT/*!*/; 


有 人 可 能 会 觉得 日 志 很 混乱 ， 但 其 实 只 要 你 理解 二 进 制 日 志 的 结构 以 及 事务 这 些 概念 ， 就 
不 会 这 样 认为 。 

二 进 制 日 志 的 每 个 条 目 都 以 两 行 注释 〈 以 # 开头 的 行 ) 开始 。 第 一 行 注释 的 号 码 是 位 置 号 
(在 at 后 面 )， 可 用 来 指定 恢复 到 哪 一 点 。 而 第 二 行 则 记录 了 语句 执行 的 时 间 及 其 他 信息 。 
最 后 ， 条 目 以 /*!1*/; 作为 结尾 。 


而 所 谓 事务 ， 通 常 就 是 指 一 组 同时 执行 且 彼 此 相关 的 SQL 语句 。 它 只 在 事务 性 表 (比如 
InnoDB) 上 可 用 ， 而 在 非 事 务 性 表 (比如 MyISAM) 上 不 可 用 。 同 一 事务 中 的 语句 ， 只 
要 还 未 提交 ， 就 可 以 全 部 撤销 或 回 深 。 而 为 了 能 如 实 恢复 数据 ， 二 进 制 日 志 会 保留 事务 语 
句 。 也 因为 这 一 特性 ， 我 们 确实 需要 看 看 日 志 中 事务 的 组 件 。 

BEGIN 和 COMMIT 是 事务 开始 和 结束 的 标志 。 其 中 ，COMMIT 会 把 该 范围 中 的 语句 提交 ， 而 一 
旦 提交 ， 就 不 能 回 深 或 撤销 了 。 从 二 进 制 日 志 开 头 往 下 看 ， 你 会 发 现 ，BEGIN 后 面 紧 跟着 
第 一 个 DELETE。 所 以 ，DELETE 是 被 夹 在 BEGIN 和 COMMIT 之 间 的 。 

第 一 个 DELETE 的 位 置 号 是 1258778。 但 是 ， 这 已 经 进入 事务 之 中 了 。 要 想 查 出 事务 的 范围 ， 
还 是 要 往 上 看 : 


# at 1258707 
#140916 13:10:24 server id 1 end_Log_pos 1258778 Query thread_id=382 











































































































到 达 BEGIN 条 目 了 ， 它 的 位 置 号 是 1258707， 日 期 和 时 间 是 140916 13:10:24 ( 即 2014 年 9 
月 16 日 下 午 1 点 10 分 24 秒 )。 因 此 ， 我 们 已 掌握 了 第 一 个 DELETE 所 在 事务 的 位 置 号 和 开 
始 时 间 。 细 看 一 下 ， 你 还 会 发 现 end_Log_pos 后 面 还 有 一 个 数字 ， 它 指 的 是 下 一 条 目的 位 
置 号 (1258778)。 不 要 被 它 迷 惑 。 其 实 ， 位 置 号 不 是 简单 地 递增 的 ， 它 记录 的 是 条 目 在 日 
志 中 的 位 置 。 
因为 我 们 要 恢复 第 一 个 DELETE 所 在 事务 之 前 的 语句 (也 就 是 说 直至 1258707)， 所 以 ， 可 
以 修改 这 个 导出 的 日 志文 本 文件 ， 去 掉 不 需要 的 事务 语句 ， 然 后 用 mysql 客户 端 读 取 并 运 
行 那些 剩 下 的 语句 。 但 其 实 ， 还 有 更 简单 的 方法 : 用 mysqlbinlog 再 一 次 导出 事务 ,但 只 
导 到 1258707 为 止 。 做 法 如 下 : 


mysqlbinlog --database=rookery --stop-position="1258707" \ 
/data/mysql/mysqlresources-bin.000002 | 
mysql --user=admin_restore --password 


这 样 ， 导 出 的 文件 就 只 包含 1258707 之 前 的 语句 了 。 
用 这 份 文件 ， 我 们 就 恢复 好 DELETE 之 前 的 操作 了 。 而 接着 ， 我 们 还 需要 恢复 第 二 个 DELETE 
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之 后 的 那些 事务 。 


在 第 二 个 DELETE 之 后 的 COMMIT 处 ， 可 以 看 到 它 的 end_Log_pos 是 1284889。 这 是 第 二 次 
删除 数据 之 后 的 第 一 个 事务 的 起 点 ， 而 我 们 就 是 要 恢复 它 之 后 的 动作 。 我 们 无 需 指 定 终点 
的 位 置 号 ， 只 要 用 - -to-Last-tLog 选项 ， 即 可 一 直 导 出 ， 直 到 日 志 的 结尾 。 顺 便 说 一 下 ， 
如 果 之 后 又 刷新 或 增加 过 二 进 制 日 志 ， 那 么 后 面 文件 的 内 容 也 会 被 输出 。 总 之 ， 使 用 如 下 




















mysqlbinlog --database=rookery --start-position="1284889" --to-last-log \ 
/data/mysql/mysqlresources-bin.000002 
mysql --user=admin_restore --password 


这 就 能 恢复 DELETE 之 后 的 所 有 操作 了 。 因 为 通过 日 志文 件 的 位 置 号 来 定位 到 指定 的 事务 ， 
所 以 此 法 能 非常 精准 地 控制 恢复 范围 。 而 除了 位 置 号 ， 还 可 以 用 开始 时 间 和 停止 时 间 来 进 
行 时 间 点 恢复 ， 用 到 的 选项 是 --start-datetine 和 --stop-datetine。 而 如 果 想 做 出 上 例 
的 效果 ， 可 以 这 样 : 

mysqlbinlog --database=rookery --stop-datetime="140916 13:10:24" \ 


/data/mysql/mysqlresources-bin.000002 | 
mysql --user=admin_restore --password 








mysqlbinlog --database=rookery --start-datetime="140916 13:10:29" --to-last-log \ 
/data/mysql/mysqlresources-bin.000002 | 
mysql --user=admin_restore --password 
很 好 理解 ， 第 一 条 语句 要 使 用 的 停止 时 间 是 第 一 个 DELETE 事务 的 开始 时 间 ， 而 第 二 条 语句 
的 开始 时 间 则 是 第 二 个 DELETE 事务 结束 的 后 一 秒 。 这 应 该 是 没什么 问题 的 ， 不 过 考虑 到 一 
秒 钟 也 可 以 执行 很 多 动作 ， 所 以 ， 想 更 精确 的 话 ， 还 得 用 位 置 号 。 


二 进 制 日 志 也 可 用 于 做 备份 ， 即 MySQL 复制 。 所 谓 复制 ， 就 是 让 另 一 个 服 
务 器 (被 称 为 从 服务 器 ) 持续 读 取 主 服务 器 的 二 进 制 日 志 。 由 此 ， 从 服务 
器 便 成 为 了 主 服务 器 的 复制 体 。 当 需要 另外 再 做 备份 时 ， 可 以 直接 用 从 服 
务 器 来 做 。 只 需 暂 停 其 对 主 服务 器 日 志 的 读 取 ， 然 后 备份 从 服务 左上 的 数 
据 库 。 做 完 后 ， 重 启 读 取 即 可 。 因 为 读 取 的 是 二 进 制 日 志 ， 所 以 从 服务 器 
很 快 就 可 以 又 与 主 服务 器 同步 。 不 过 ， 此 话题 已 超出 本 书 范围 。 如 果 想 了 
解 或 学 习 如 何 解决 复制 问题 ， 可 以 参考 我 的 另 一 本 书 MSOL Replication: An 
Administrator's Guide to Replication in MySOL (A Silent Killdeer Publishing， 
2010)。 
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14.3 制定 备份 策略 


学 会 备份 和 恢复 数据 库 没 错 ， 但 这 些 技能 也 只 在 你 需要 定期 、 有效 地 做 备份 时 才 有 意义 。 
若是 你 的 恢复 会 损坏 数据 库 ， 或 导致 更 多 的 数据 损失 ， 或 其 过 程 太 过 缓慢 ， 那 备份 的 价值 
就 大 打折 扣 了 。 要 想 成 为 优秀 的 数据 库 管 理 员 ， 你 还 需要 学 会 制定 备份 策略 ， 并 将 其 落实 
执行 。 
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备份 策略 需要 留 底 ， 即 使 仅 有 你 一 个 人 看 。 而 且 ， 它 应 该 涵盖 备份 和 恢复 的 各 个 方面 。 制 











定 备份 策略 时 ， 需 要 考虑 实际 情况 ， 根 据 各 数据 库 的 价值 、 数 据 的 敏感 程度 ， 以 及 其 他 因 
素 而 定 。 举 个 例子 ， 假 如 你 的 数据 库 仅 用 作 个 人 网 站 的 数据 保存 ， 不 用 来 赚钱 ， 也 与 其 他 
人 设 有 利害 关系 ， 并 且 其 内 容 不 常 更 新 ， 那 么 ， 你 的 策略 可 以 是 一 周 做 一 次 完整 的 备份 ， 
并 让 每 个 备份 最 少 保留 一 个 月 。 而 如 果 你 是 一 个 大 型 网 站 的 数据 库 管 理 员 ， 该 网 站 有 数 
































会 明白 制定 策略 时 要 思考 些 什 么 。 


要 制定 策略 ， 首 先 就 是 搞 清楚 
rookery 和 birdwatchers 这 两 个 数据 库 。 
多 会 员 。 为 模拟 这 个 情况 ， 我 特意 增加 了 大 多 数 表 的 行 数 ， 二 















































百 万 行 数据 置 于 多 个 表 中 ， 每 日 有 数 千 人 访问 ， 并 且 存 有 价值 巨大 的 一 些 信用 卡号 码 ， 那 
么 你 的 备份 策略 要 做 得 更 加 精细 才 行 。 在 这 种 情况 下 ， 需 要 考虑 到 数据 安全 、 访 问 阻塞 和 
恢复 速度 的 问题 。 而 本 市 接 下 来 介绍 的 例子 ， 则 处 于 这 两 种 极端 之 间 。 通 过 例子 ， 你 应 该 





自己 要 负责 哪些 数据 库 和 表 。 本 例 将 用 到 贯穿 全 书 的 





现 假设 我 们 的 观 鸟 网 站 已 运行 了 多 年 ， 吸 引 了 众 











删除 了 一 些 临 时 用 的 表 。 而 


这 大 量 的 数据 也 使 制定 策略 显得 十 分 必要 。 最 后 ， 为 明确 需要 备份 哪些 表 ， 我 将 它们 按 数 


据 库 分 组 ， 并 以 字母 序列 出 ， 如 表 14-1 所 示 。 


表 14-1: 评估 用 于 备份 策略 的 数据 库 





表 全 二 更 新 繁 敏 感 
rookery 

bird families 229 y 

bird images 8 

bird_orders 32 y 

birds 28 892 y 
birds_bill_shapes 9 

birds_body_shapes 14 

birds details 0 

birds_habitats 12 

birds wing_shapes 6 

habitat_codes 9 

birdwatchers 

bird identification_tests 3201 y y 

bird_sightings 12 435 y y 

birder families 96 y 
birding_events 42 y 

birding events_children 34 y 
humans 1822 y y y 
prize_ winners 42 y 

survey_answers 736 

survey_questions 28 

surveys 16 
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该 表 所 列 的 关于 两 个 数据 库 的 参数 ， 对 如 何 制定 策略 至 关 重要 。 这 些 参数 是 : 每 个 表 的 行 
数 、 更 新 情况 (数据 和 结构 是 否 经 常 改变 )、 访 问 热度 和 敏感 程度 。 当 然 ， 你 自己 制定 策 
略 时 ， 可 以 考虑 其 他 因素 ， 但 此 例 暂 时 只 考虑 这 几 个 方面 。 

一 般 来 说 ， 对 于 那些 不 常 更 新 的 表 ， 是 否 每 日 备份 无 关 紧 要 。 而 那些 经 常 更 新 的 表 则 要 每 
日 备份 ， 并 选择 在 不 太 繁忙 的 时 间 进 行 。 如 果 某 个 表 含 有 敏感 数据 (比如 会 员 的 个 人 或 家 
庭 信息 ) ， 则 要 用 特殊 的 用 户 账号 来 执行 备份 ， 并 将 备份 文件 放 到 更 安全 的 目录 下 。 同 时 ， 
每 周 做 一 次 完整 的 备份 ， 因 为 dump 文件 也 会 包含 敏感 数据 ， 所 以 也 要 将 其 放 在 刚才 提 到 
的 安全 目录 下 。 

记 住 这 些 之 后 ， 就 可 以 开始 计划 各 数据 库 和 表 的 备份 时 间 和 存放 目录 了 。 如 表 14-2 所 示 ， 
因为 我 先 将 备份 按 数 据 库 分 组 ， 然 后 再 按 保密 程度 和 用 途 来 分 ， 所以， 有 些 备份 文件 会 包 
含 整个 数据 库 的 所 有 表 ， 而 有 些 则 只 包含 部 分 。 此 外 ， 我 还 在 右 侧 列 出 每 个 备份 的 产生 周 
期 、 有 具体 时 间 、 是 否 需要 保密 ， 以 及 是 否 离线 存储 。 


表 14-2: 备份 计划 





































































































后 入 频率 日 期 时 间 是 否 保密 是 否 离线 存储 
rookery 整个 数据 库 每 周 周一 8:00 否 是 
所 有 表 

(rookery-yyyy-mmm-dd.sql) 

rookery 鸟 类 信息 每 日 每 日 9:00 否 否 
birds、 bird families、 bird orders 

(rookery-class-yyyy-mmm-dd.sql) 

birdwatchers 整个 数据 库 每 周 周一 8:30 是 是 
所 有 表 

(birdwatchers-yyyy-mmm-dd.sql) 

birdwatchers 观 鸟 者 相关 信息 每 日 每 日 9:30 是 否 
humans、birder_families、birding_events_children 

(birdwatchers-people-yyyy-mmm-dd.sql) 

birdwatchers 活动 信息 每 日 每 日 10:00 否 否 


bird_sightings、birding_events、bird_identification_tests、 
prize winners、 surveys、survey_answers、survey_questions 
(birdwatchers-activities-yyyy-mmm-dd.sql) 


注 : 时 间 按 G.M.T.。 含 敏感 信息 的 备份 需要 用 特殊 的 管理 员 账 号 来 操作 ， 并 存放 在 安全 的 目录 下 。 而 且 ， 
有 些 需 要 离线 存储 。 


注意 ， 上 表 计 划 每 周 做 一 次 全 数据 库 备 份 ， 每 个 数据 库 单 狐 有 一 个 dump 文件 。 你 可 能 想 
将 它们 合 在 一 起 ， 但 我 认为 分 开会 更 方便 我 们 之 后 恢复 某 一 个 数据 库 。 

而 除了 每 周一 次 的 全 数据 库 备 份 ， 我 们 还 规定 了 让 某 些 经 常 更 新 的 表 每 天 备份 ， 不 管 是 内 
容 还 是 结构 都 要 备份 。 虽 然 有 些 表 不 常 更 新 ， 本 不 需要 频繁 备份 ， 但 因为 它们 也 不 是 很 
大 ， 所 以 每 天 备份 一 次 也 没什么 问题 。 有 些 人 可 能 觉得 ， 每 天 都 备份 全 数据 库 是 最 简单 
的 。 但 如 果 数 据 库 非常 庞大 ， 或 者 你 担心 安全 和 性 能 问题 ， 那 这 就 不 是 最 佳 选择 了 。 所 
以 ,为 了 让 你 懂得 从 各 个 角度 来 考虑 问题 ， 这 里 的 例子 针对 不 同 的 表 有 不 同 的 方案 。 
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在 我 们 这 个 虚构 的 观 鸟 网 站 中 ， 有 很 多 来 自 欧 洲 和 美国 的 会 员 。 因 为 观 鸟 对 大 多 数 人 
来 说 只 是 一 种 爱好 ， 所 以 人 们 都 是 在 晚上 才 访 问 我 们 的 网 站 。 因 此 ， 我 们 把 时 间 定 在 
G.M.T. 的 早上 。 等 到 伦敦 时 间 早 上 8 点 ， 就 局 动 第 一 个 备份 命令 ， 而 旧金山 此 时 正 是 午 
人 夜 。 换 句 话 说 ， 我 们 是 在 美国 的 深夜 时 分 开始 做 备份 ， 因 为 这 应 该 是 数据 库 流量 最 少 的 
时 段 。 

我 们 将 所 有 的 备份 保留 在 本 机 和 两 个 单独 的 服务 器 上 。 通 过 内 了 网， 使 用 cron 把 dump 文 
件 自动 复制 到 第 二 个 服务 器 上 。 此 外 ， 考 虑 到 火灾 或 其 他 灾难 可 能 毁坏 同一 栋 楼 的 服务 
器 ， 所 以 ， 我 们 还 要 把 每 周 的 全 数据 库 备 份 复制 到 DropBox 或 Google Drive 之 类 的 云 服 
务 器 上 。 

除了 备份 计划 ， 还 需要 备份 验证 计划 ( 见 表 14-3)， 以 确保 备份 得 以 正确 执行 。 该 计划 包 
括 : 查看 备份 文件 是 否 生 成 ， 并 测试 生成 的 文件 能 否 用 来 做 恢复 。 这 个 计划 还 能 锻炼 我 
们 的 恢复 技能 。 其 实 我 已 说 过 多 次 ， 一旦 发 生 需 要 恢复 数据 这 种 紧急 情况 ， 你 就 得 马上 投 
入 ， 做 该 做 的 事 。 到 发 生 紧 急 情 况 时 才学 习 是 不 太 可 能 的 ， 所 以 ， 平 时 就 要 进行 操练 。 

表 14-3: 备份 验证 计划 































































































备 份 验 ”证 库 恢复 测试 表 恢 复 测试 行 恢复 测试 保留 期 限 
rookery 整个 数据 库 每 周 每 月 无 半月 两 月 
rookery 鸟 类 信息 每 周 无 半月 半月 一 月 
birdwatchers 整个 数据 库 每 局 每 月 无 半月 两 月 
birdwatchers 观 鸟 者 相关 信息 每 周 无 半月 半月 一 月 
birdwatchers 活动 信息 每 周 无 半月 半月 | 

















注 : 定期 检查 备份 文件 。 此 外 ， 出 于 测试 和 练习 的 需要 ， 还 会 在 测试 环境 中 ， 定 期 进行 数据 库 、 表 、 行 的 
恢复 。 
现在 ,仔细 看 看 该 计划 。 我 们 的 检查 将 每 周 进行 一 次 : 检查 该 周 要 做 的 dump 文件 到 底 有 
没有 生成 ， 以 及 文件 中 到 底 有 没有 我 们 需要 的 表 。 具 体 来 说 ， 就 是 检查 文件 是 否 存在 ， 大 
小 如 何 。 另 外 ， 可 以 用 文本 编辑 器 打开 它们 ， 看 看 内 容 对 不 对 。 也 可 以 用 grep 来 抽取 含 
CREATE TABLE 的 行 ， 以 得 到 表 名 。 例 如 ， 用 以 下 命令 就 可 以 截取 出 rookery.sql 所 含 的 表 


grep 'CREATE TABLE' rookery.sql | grep -oP '(?<=CREATE\ TABLE\ \).*(?=\ ) 























bird_families 
bird_images 
bird_orders 
birdlife_ list 
birds 
birds_bill_shapes 
birds_body_shapes 
birds details 
birds_habitats 
birds wing_shapes 
conservation_status 
habitat_codes 
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表 14-3 接 下 来 的 三 列 则 与 测试 和 恢复 数据 有 关 。 全 数据 库 恢 复 是 每 月 测试 一 次 。 你 可 以 在 
测试 环境 中 进行 ， 恢 复 过 后 ， 在 正式 环境 和 测试 环境 都 执行 查询 ， 对 比 看 看 结果 有 没有 出 
入 (应 该 略 有 不 同 )。 


其 他 dump 文件 是 基于 表 的 。 这 些 表 要 么 是 经 常 更 新 的 ， 要 么 对 于 我 们 的 观 鸟 网 站 来 说 
十 分 重要 。 所 以 基于 表 的 恢复 测试 ， 我 们 半月 做 一 次 。 此 外 ， 鉴 于 行 恢复 是 比较 常见 的 
需求 ， 对 于 所 有 备份 ， 我 们 都 进行 半月 一 次 的 行 恢复 。 知 道 怎样 从 所 有 dump 文件 中 恢 
复 指定 的 数据 ， 是 非常 重要 的 。 只 要 多 加 练习 ， 在 需要 恢复 丢失 的 少量 数据 时 ， 就 不 用 
太 担 心 。 


最 后 一 列 是 关于 备份 文件 保留 时 长 的 。 目 前 的 计划 是 全 数据 库 备 份 最 多 保留 两 个 月 ， 表 备 
份 则 保留 一 个 月 。 当 然 ， 这 个 随 个 人 需要 而 定 。 有 人 甚至 会 把 每 个 月 的 dump 文件 刻 到 光 
盘 上 ， 以 便 保 存 好 几 年 。 


我 们 的 备份 策略 大 致 就 如 表 14-2 和 表 14-3 所 示 。 其 中 ， 表 14-2 规定 的 是 备份 什么 、 何 时 
备份 ， 以 及 备份 到 哪里 。 而 表 14-3 规定 的 则 是 检查 备份 是 否 成 功 、 恢 复 的 周期 ， 以 及 备份 
的 保存 期 限 。 除 了 这 些 以 外 ， 影 响 备份 策 略 的 因素 还 有 很 多 ， 你 可 以 自己 加 到 表 中 。 但 无 
论 怎 样 ， 本 节 的 思路 都 值得 参考 。 


14.4 ”小 结 


现在 ， 你 应 该 很 清楚 备份 的 重要 性 了 。 做 好 备份 ， 便 能 摆脱 数据 丢失 的 危机 。 而 熟练 掌握 
各 种 恢复 技巧 ， 则 能 让 你 更 灵活 地 解决 问题 。 此 外 ， 为 了 让 你 对 备份 和 恢复 的 学 习 及 锻炼 
不 至 于 白费 ， 应 该 制定 合理 的 备份 策略 ， 并 严格 遵守 之 。 


如 本 章 开头 所 述 ， 备 份 工具 不 止 一 种 ,而且 方法 也 是 多 样 的 (其 至 可 以 用 MySQL 复制 来 
做 )。 其 中 mysqtdunp 是 最 简单 的 ， 在 有 些 情况 下 ， 它 还 是 最 佳 选 择 。 如 果 你 是 数据 库 管理 
员 ， 就 应 该 好 好 掌握 这 一 工具 ， 并 学 会 如 何 用 dump 文件 做 恢复 。 最 后 ， 为 了 练 手 ， 请 完 
成 下 一 节 的 习题 。 


14.5 习题 


以 下 题目 可 使 你 更 加 熟悉 如 何 用 mysqtdump 生成 备份 ， 以 及 用 生成 的 备份 文件 进行 恢复 。 
因此 ， 你 应 尽力 完成 它们 。 其 中 某 些 题 是 有 难度 的 ， 一 下 子 没 做 出 来 的 话 ， 也 请 多 尝试 。 


(1]) 为 了 让 接 下 来 的 练习 不 出 什么 问题 ， 先 用 mysqtdump 做 两 个 备份 。 一 个 是 备份 所 有 数据 

库 ， 另 一 个 是 备份 rookery 和 birdwatchers (到 同一 个 dump 文件 中 )。 但 注意 ， 接 下 来 
的 练习 不 要 使 用 这 两 个 备份 文件 。 保 留 它 们 ， 万 一 出 错 了 ， 你 需要 用 它们 做 恢复 。 

(2) 参 考 表 14-2。 它 包含 一 列 需 要 定期 创建 的 备份 ， 有 两 个 全 数据 库 备 份 ， 以 及 三 个 基于 
表 的 备份 。 用 mysqldump 创建 这 五 个 备份 ， 要 求生 成 的 dump 文件 按 表 中 的 命名 规范 来 
取 名 字 。 

(3) 重 做 第 2 题 ， 但 用 五 个 shell 脚本 来 分 别 产 生 这 五 个 备份 。 备 份 文件 的 名 字 要 符合 命名 

规范 ， 并 根据 当前 日 期 来 生成 。 关 于 如 何 写 脚本 ， 可 以 参考 14.1.4 市 中 的 例子 。 直 接 在 

这 个 脚本 上 修改 ， 或 自己 重 写 。 当 然 也 可 以 使 用 shell 以 外 的 编程 语言 。 
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写 完 后 ， 执 行 它们 ， 看 看 能 不 能 生成 那 五 个 备份 ， 以 及 名 字 都 对 不 对 。 如 果 环 境 允 
许 ， 就 将 发 起 这 些 脚 本 的 命令 加 到 crontab 中 (或 其 他 调度 工具 中 )， 让 它们 定期 
自动 运行 《最 好 能 尽快 运行 一 次 )。 然 后 看 它们 能 否 按时 备份 。 试 完 之 后 ， 便 可 从 
crontab 中 请 除 。 

(4) 修改 上 一 题 的 脚本 ， 使 它们 能 按 表 14-3 所 定 的 保留 期 限 来 清理 旧 备 份 。 你 可 以 这 样 制 
造 测 试 数据 : 把 生成 的 备份 文件 复制 出 几 份 ， 并 修改 日 期 后 级 ， 使 一 些 文件 “过 期 ”， 
一 些 “ 未 过 期 ”。 
然后 ， 再 执行 脚本 ,看 看 有 没有 删除 过 期 备份 (可 能 需要 试 几 次 )。 

(5) 登录 MySQL， 用 DROP TABLE 删除 birds_bill_shapes 和 birds_body_shapes。 
接着 ， 用 第 2 题 所 生成 的 rookery 全 数据 库 备份 ， 来 恢复 这 两 个 表 。 操 作 完 后 ， 登 录 
MySQL 并 检查 是 否 恢复 成 功 ， 数 据 是 否 存在 。 

(0) 登 录 MySQL， 将 birds 表 中 含 Parrot 字眼 的 common_name 全 都 更 新 成 NULL。 应 该 有 
185 行 。 

把 rookery.sql 复制 一 份 ， 命 名 为 rookery_temp.sql。 然 后 将 其 中 的 数据 库 名 字 改 为 
rookery_temp。 若 忘记 了 怎么 改 ， 可 参考 14.2.3 节 。 

然后 ， 用 rookery_temp.sql 创建 rookery_temp 数据 库 ， 并 用 UPDATE， 依 据 rookery_ 
temp.birds， 恢复 rookery.birds 中 俗名 含有 Parrot 的 行 。 

0) 开启 二 进 制 日 志 这 一 功能 (开启 方法 请 参考 14.2.4 他。 开启 后 ， 记 得 重启 MySQL)。 然 
后 用 mysqLdump， 带 上 --fLush-Logs 选项 ， 只 备份 rookery 的 birds 表 。 
完成 上 述 要 求 后 ， 登 录 MySQL， 用 DELETE 删除 birds 表 中 俗名 带 Gray 的 行 ， 再 插入 
几 行 《可 自己 编 一 些 俗名 ， 并 让 其 他 栏 位 留 空 ) 。 
然后 ， 用 刚才 备份 的 dump 文件 来 恢复 birds 表 。 再 用 14.2.4 节 所 提 到 的 时 间 点 恢复 方 
法 ， 配 合 mysqlbinlog， 恢复 (当前 ) 二 进 制 日 志 中 ， 删 除 Gray 鸟 的 DELETE 语句 前 的 
所 有 事务 。( 需 要 找 出 该 DELETE 在 日 志 中 的 位 置 号 。) 
接着 ， 用 这 个 位 置 号 恢复 该 DELETE 后 ， 直 到 二 进 制 日 志 结 尾 的 所 有 事务 。 

都 恢复 完 后 ， 登 录 MySQL， 检 查 数据 是 否 恢 复 。 完 成 所 有 习题 后 ， 如 果 不 再 需要 记录 
事务 ， 记 得 停 用 二 进 制 日 志 。 
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第 15 章 


批量 导入 数据 





本 章 将 介绍 各 种 批量 导入 数据 的 方法 。 有 了 这 些 方法 ， 当 你 想 用 MySQL 或 MariaDB 来 
替换 使 用 另 一 种 数据 库 系统 (或 另 一 种 存储 格式 ) 的 数据 库 时 ,或 者 当 你 想 从 某 种 非 数 据 
库 软 件 将 数据 提取 到 MySQL 或 MariaDB 中 时 ， 就 无 需 手 动 录 入 数据 ， 而 直接 选择 批量 
导入 。 


但 这 里 还 有 一 些 要 求 。 如 果 数 据 来 源 于 另 一 种 应 用 程序 ， 需 要 确保 从 它 导 出 的 数据 符合 
MySQL 的 读 取 习 惯 。 例 如 ， 将 每 项 数据 用 特定 的 字符 分 隔 好 ， 并 放 在 文本 文件 中 ， 这 样 
是 可 以 接受 的 。 无 论 数据 量 有 多 大 ， 只 要 整理 好 它 的 格式 ， 并 保存 在 文本 文件 中 ， 你 就 可 
以 用 LOAD DATA INFILE 语句 来 导入 数据 。 


这 不 是 难事 ， 但 第 一 次 导入 大 量 数据 的 过 程 ， 可 能 会 让 人 感到 紧张 ， 甚 至 望而却步 。 这 会 
是 将 数据 迁移 到 MySQL 或 MariaDB 的 一 个 障碍 。 要 想 做 好 一 次 完美 的 导入 ， 确 实 有 很 多 
细 市 需要 注意 ， 特 别 是 当 你 想 更 进一步 把 这 个 过 程 自动 化 时 ， 要 考虑 的 就 更 多 了 。 另 外 ， 
如 果 你 是 要 把 数据 导入 托管 站 ， 那 还 要 对 限制 条 件 有 些 心 理 准 备 。 而 这 些 问 题 都 会 在 本 章 
讨论 。 


15.1 准备 导 


要 想 把 数据 导入 MySQL 或 MariaDB ， 需 要 将 数据 整理 成 一 种 它们 读 得 懂 的 格式 。 事 实 
上 ， 只 要 是 把 数据 保存 在 文本 文件 中 ， 并 以 某 种 形式 分 隔 每 个 数据 项 ， 就 已 经 符合 它们 的 
要 求 了 。 如 果 你 的 数据 不 是 这 样 ， 那 最 简单 的 方法 就 是 把 它 导 回 其 来 源 软 件 ， 然 后 再 导出 
成 内 容 带 有 分 隔 符号 的 文本 文件 。 一 般 的 软件 应 该 都 有 这 样 的 功能 。 而 它们 导出 的 文件 通 
常 以 逗号 来 分 隔 每 个 域 ， 并 通过 换行 来 分 隔 每 条 记录 。 有 些 软件 允许 自 定义 分 隔 符 。 可 以 
选择 用 坚 线 来 分 隔 每 个 域 (因为 紧 线 不 太 会 出 现在 实际 数据 中 ) ， 然 后 通过 换行 来 分 隔 每 
条 记录 。 
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现在 我 们 先 获 取 一 个 与 rookery 数据 库 有 关 的 大 数据 文件 。 我 们 知道 ， 康 奈 尔 大 学 在 鸟 
类 学 研究 方面 非常 有 名 ， 该 校 甚至 还 通过 自己 的 出 版 社 发 行 过 相关 的 书籍 。 而 其 中 一 本 
就 是 由 James F. Clements 编著 的 《世界 鸟 类 名 录 》 (The Clements Checklist of Birds of the 
World)。 我 们 可 以 从 其 网 站 (http://www.birds.cornell.edu/clementschecklist/) 获取 此 书 的 鸟 
种 列表 。 它 是 一 个 过 号 分 隔 值 (Comma-Separated Values，CSV) 文件 ， 每 年 八 月 都 会 更 
新 一 次 ， 并 免费 提供 给 人 们 或 组 织 使 用 ， 以 促进 鸟 类 研究 和 鉴赏 事业 的 发 展 。 


假设 我 们 想 拿 这 份 最 新 的 鸟 种 表 与 我 们 的 birds 表 对 比 ， 看 有 没有 什么 新 的 鸟 种 。 这 听 
起 来 好 像 很 麻烦 ， 但 其 实 并 不 难 。 为 此 ， 我 们 需要 从 上 康 奈 尔 大 学 的 网 站 或 MySQL 资源 
站 (http://mysqlresources.com/files) 下 载 该 表 。 在 下 文 的 示例 中 ， 我 用 到 的 是 Clements- 
Checklist-6.9-final.csv。 









































如 果 通 过 FTP 把 数据 文件 上 传 到 服务 器 ， 记 得 要 用 ASCI 模式 来 传 ， 不 要 用 
二 进 制 模式 。 如 果 文 件 本 身 就 包含 二 进 制 字符 或 二 进 制 换行 符 ， 也 一 样 不 能 
被 MySQL 读 取 。 

















下 载 好 康 奈 尔 大 学 的 数据 文件 之 后 ， 用 文本 编辑 器 打开 它 ， 看 看 里 面 的 内 容 。 你 需要 关心 
的 是 ， 它 的 每 条 记录 、 每 一 个 域 以 什么 符号 来 做 分 了 喇 。 以 下 是 我 下 载 的 文件 的 部 分 内 容 : 
sort 6.9,CLements 6.9 change,2014 Text for website, 


Category ,Scientific name,English name,Range, 
Order ,Family,Extinct,Extinction Year,sort 6.8,sort 6.7,page 6.0,,,,, 











4073,new species,"Walters (1991) and Cibois et al. (2012) proposed 
recognition of Prosobonia ellisi Sharpe 1906, with English name 
Moorea Sandpiper and range ""extinct; 
formerLy Moorea (Society Islands)"".", 
species,Prosobonia ellisi,Moorea Sandpiper ,extinct; 
formerly Moorea (Society Islands), 
Charadriiformes,Scolopacidae (Sandpipers and Allies) 
;1,XXxXx,, ,addition (2014),,;,，, 


6707,new species,"Robb et al. (2013) describe a new species of owl, Omani Owl 
(Strix omanensis), from the Arabian Peninsula, with range 

""central AL Hajar mountains, northern Oman"". 

Position Omani Owl immediately following Hume's Owl (Strix butleri).", 

species, inStrix omanensis,Omani Owl,"central AL Hajar mountains, northern Oman", 


Strigiformes,Strigidae (Owls),,,,,addition (2014),,,,, 


该 CSV 文件 大 概 有 32 000 行 ， 而 我 只 截 出 某 些 我 感 兴趣 的 行 。 并 且 ， 因 为 每 条 记录 都 很 
长 ， 所 以 我 只 好 手动 换行 ， 使 它 符 合 页 宽 。 

第 一 行 是 每 个 域 的 名 字 。 你 或 许 没 能 一 下 子 看 懂 它 们 ， 因 为 它们 有 些 用 于 与 早期 发 布 的 列 
表 进行 对 照 。 比 如 ， 第 一 个 域 ，sort 6.9， 其 实 是 指 每 一 行 的 标识 号 。 而 后 面 的 sort 6.8 














批量 导入 数据 | 241 





和 sort 6.7 就 是 该 记录 在 旧 表 中 的 标识 号 。 虽 然 此 表 还 有 很 多 域 ， 但 对 于 本 章 要 演示 的 例 
子 来 说 ， 我 们 只 需 关 注 Clements 6.9 change、Scientific name、English name、0rder 和 
Family 这 几 个 域 。 


Clements 6.9 change 用 于 描述 该 记录 与 上 一 份 表 相 比 有 什么 变化 。 而 现在 ， 我 们 想 看 的 是 


new species, 


我 所 截 出 的 两 条 记录 都 需要 导入 。 其 中 4073 那 条 记录 就 是 一 个 新 鸟 种 ，M| Prosobonia ellisi 
或 Moorea Sandpiper。 但 很 可 惜 的 是 ， 这 种 岛 已 经 灭绝 了 。 尽 管 有 些 鸟 种 已 经 天 绝 ， 但 鸟 
类 学 家 还 是 会 把 它们 都 记录 下 来 。 同 样 ， 为 了 遵守 这 一 规则 ， 我 们 也 要 把 它 加 到 birds 表 
中 (虽然 不 会 再 有 人 能 观察 到 这 种 鸟 )。 而 6767 是 另 一 个 新 鸟 种 ， 叫 Strix omanensis 或 
Omani Ow1， 来 自 阿 拉 伯 半岛 。 还 好 ， 它 仍 存活 着 。 


在 导入 之 前 ， 先 把 这 个 CSV 文件 放 到 服务 器 上 ， 并 且 让 它 处 在 MySQL 能 读 取 的 一 个 目录 
下 。 为 了 安全 起 见 ， 这 个 目录 应 该 只 有 MySQL 才能 读 取 。 不 过 ， 为 了 方便 ， 这 次 我 们 就 
把 它 临时 放 到 /tmp 目录 下 。 

接 下 来 ， 建 一 个 用 于 接收 这 些 数据 的 表 。 虽 然 这 个 CSV 文件 售 有 的 行 和 列 超过 了 我 们 的 
需要 ， 但 导入 32 000 行 也 不 过 是 几 秒 钟 的 事 。 所 以 ， 不 用 太 担 心 大 小 问题 。 


尽管 可 以 把 它 直 接 导 入 现存 的 表 ， 但 最 好 还 是 建 一 个 专门 用 于 导入 数据 的 表 。 这 样 ， 当 要 
把 数据 复制 到 现存 的 表 中 时 ， 用 INSERT INT0.. .SELECT 即 可 。 建 表 语 名 如下: 

CREATE TABLE rookery.clements_list import 

(id INT, change_type VARCHAR(255), 

coL2 CHAR(Q0), col3 CHAR(0), 

scientific_ name VARCHAR(255), 

english_name VARCHAR(255), 

col6 CHAR(0), ‘order. VARCHAR(255), 

family VARCHAR(255), 

coL9 CHAR(0), col10 CHAR(0), 

coL11 CHAR(0), col12 CHAR(0), 

coL13 CHAR(0), col14 CHAR(0), 

coL15 CHAR(0), col16 CHAR(0), col17 CHAR(0)); 


这 个 表 的 列 会 与 CSV 文件 的 每 个 域 一 一 对 应 ， 而 且 顺 序 也 一 样 。 对 于 那些 用 不 到 的 域 ， 
我 们 就 直接 用 号 数 来 给 它们 起 名 ， 并 把 类 型 设 为 CHAR(0) ( 定 长 字符 串 ， 且 长 度 为 零 )， 这 
样 这 些 域 就 不 会 被 存储 了 。 其 实 还 有 一 个 更 好 的 做 法 ， 就 是 只 导入 我 们 想 要 的 列 。 我 们 在 
本 章 后 面 会 讲 到 这 种 做 法 。 和 暂时 就 用 简单 的 方法 ， 你 只 要 忽略 多 出 的 列 即 可 。 


那些 有 用 的 列 则 被 赋予 了 与 原 域 意义 接近 的 名 字 ， 并 设 为 VARCHAR(255) 型 。 注 意 ，order 
列 需 要 加 反 引 号 ， 因 为 order 本 身 是 保留 字 〈 比 如 ， 用 于 ORDER BY)。 只 要 在 用 到 该 列 时 
都 带 上 反 引 号 ， 那 么 命名 为 order 是 没有 问题 的 。 否 则 ，MySQL 就 无 法 辨认 它 ， 并 导致 出 
现 错误 。 

至 此 ， 我 们 已 下 载 好 用 来 导入 的 数据 文件 ， 也 已 将 它 放 到 了 MySQL 能 查看 的 目录 下 。 
我 们 决定 了 该 文件 的 格式 ， 并 按 该 格式 创建 了 一 个 表 来 接收 数据 。 下 面 就 可 以 进行 数据 
导 和 人 了。 
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15.2 ”导入 数据 的 基本 做 法 


要 把 数据 导入 MySQL 或 MariaDB ， 需 要 使 用 带 有 FILE 权限 的 管理 员 账号 ， 而 第 13 章 所 
建 的 admin_import 正 符合 要 求 。 


我 们 可 以 用 LOAD DATA INFILE 来 从 文本 文件 中 加 载 数据 。 它 是 多 功能 的 语句 ， 可 带 各 种 选 
项 和 子 句 。 本 章 会 对 它们 逐一 进行 讲解 。 如 果 你 想 以 最 简单 on Clements-Checklist- 
6.9-finalcsv 的 数据 导入 list_import 表 ， 可 输入 以 下 命令 : 

LOAD DATA INFILE '/tmp/Clements-Checklist-6.9-final.csv' 


INTO TABLE rookery.clements_ list import 
FIELDS TERMINATED BY ','; 


首先 ， 我们 注意 到 ， 在 这 条 SQL 语句 中 ， 文 件 路 径 与 文件 名 位 于 引号 之 间 。 而 到 底 使 用 

单 引 号 还 是 双 引 号 ， 是 无 所 谓 的 。 然 后 ， 看 看 FIELDS 子 句 。 该 子 句 告诉 MySQL， 文 件 中 

的 各 个 域 是 如 何 分 隔 的 。 因 为 我 们 导入 的 文件 是 以 逗号 来 划分 域 的 ， 所 以 FIELDS 子 句 加 了 

TERMINATED BY 秽 套 子 句 ， 以 及 一 个 逗号 ( 需 加 引号 )。 

虽然 还 有 其 他 子 句 和 仍 套 子 句 ， 但 这 就 是 LOAD DATA INFILE 的 基本 写法 。 不 过 这 样 写 其 实 
是 有 点 问题 的 ， 它 会 生成 警告 信息 。 


15.2.1 检查 警告 信息 


输入 上 例 的 语句 ， 你 会 看 到 很 多 警告 信息 。 以 下 是 执行 该 语句 后 的 返回 信息 ， 以 及 SHOW 
WARNINGS 的 头 几 行 : 


Query OK, 32187 rows affected, 65535 warnings (0.67 sec) 
Records: 32187 Deleted: 0 Skipped: 0 Warnings: 209249 









































SHOW WARNINGS; 


+--------- +------ 4 + 
| Level | Code | Message | 
+--------- +------ 4 + 
| Warning | 1366 | Incorrect integer value: 'sort 6.9' for column 'id' at row 1 | 
| Warning | 1265 | Data truncated for column 'col2' at row 1 | 
| Warning | 1265 | Data truncated for column 'col3' at row 1 | 


加 SHOW WARNINGS 语句 ， 查 看 所 有 警告 信息 。 而 因为 刚才 总 共产 生 了 209 249 个 警 

， 所 以 我 就 只 列举 了 开头 部 分 。 事 实 上 ， 剩 下 的 那些 警告 说 的 都 是 类 似 的 问题 。 这 些 问 
a 你 :把 数据 文件 中 有 值 的 域 导入 了 长 度 为 夫 的 CHAR 列 。 遇 到 这 种 情况 
时 ，MySQL 就 会 自动 将 值 截 短 ， 而 后 再 塞 到 列 中 ， 并 报告 每 个 进行 过 这 种 操作 的 列 。 我 
们 可 以 研究 一 下 表 中 的 数据 样本 ， 以 便 更 清楚 地 看 出 这 到 底 是 什么 问题 ， 以 及 MySQL 做 
了 怎样 的 处 理 : 


SELECT * FROM rookery.clements_list import LIMIT 2 \G; 























类 淡淡 淡 火 火炎 火炎 类 炎炎 淡淡 火 火炎 类 大 类 类 炎炎 火 火 火炎 > row 类 淡淡 火 火 火炎 大 大 类 淡淡 火 火炎 火炎 类 尖 类 淡淡 汪 火炎 火炎 


id: 0 
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change_type: Clements 6.9 change 
col2: 
col3: 
scientific name: Scientific name 
english name: English name 
colé: 
order: Order 
family: Family 
col9: 
col10: 
col12: 
col13: 
col14: 
col15: 
col16: 
col17: 
类 淡淡 淡 火 火炎 火炎 类 火 炎炎 火炎 类 类 火炎 火 火 炎炎 火炎 类 类 2 row 类 淡淡 火炎 火 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 炎炎 火炎 
id: 1 
change_type: 
col2: 
col3: 
scientific name: Struthio camelus 
english _ name: Ostrich 
colé: 
order: Struthioniformes 
family: Struthionidae (Ostrich) 
col9: 
col10: 
col12: 
col13: 
col14: 
col15: 
col16: 
col17: 


这 样 看 来 ， 我 们 的 LOAD DATA INFILE 操作 是 成 功 的 。 数 据 文件 的 域 和 表 的 列 都 对 上 了 。 不 
过 ， 第 一 行 导 入 了 数据 文件 的 表 头 。 虽 然 我 们 不 需要 它 ， 但 这 也 没什么 大 碍 。 第 二 行 就 清 
楚 地 显示 出 ， 我 们 把 数据 都 导入 了 正确 的 列 : 鸟 的 学 名 、 俗 名 、 目 名 、 科 名 都 齐 了 。 而 那 
些 我 们 不 需要 的 域 ， 其 对 应 的 列 也 确实 没 导入 任何 数据 。 这 样 是 没什么 问题 的 。 不 过 ,我 
之 前 也 说 过 ， 其 实 我 们 可 以 把 表 做 得 更 整洁 ， 使 我 们 显得 更 专业 。 有 具体 的 做 法 稍 后 再 谈 。 
先 把 新 鸟 种 加 入 birds 表 。 


15.2.2 ”检查 导入 是 否 准 确 


在 往 birds 表 中 插入 数据 之 前 ， 先 检查 clements_list_import 表 中 的 数据 导入 得 是 否 正 确 。 
输入 以 下 SELECT 语句 ， 查 出 new species 的 行 ， 并 检查 结果 : 


SELECT id, change_type, 

scientific_name, english_nanme, 

“order’, fanmily 

FROM rookery.clements_list_ import 

WHERE change_type = 'new species' LIMIT 2 \G 

































































类 火 淡淡 火炎 淡 火 炎炎 火炎 类 火炎 火炎 火炎 火炎 类 火 火炎 火 尖 二 row 类 淡淡 淡 火炎 火 火 淡淡 火 火炎 火炎 类 淡 火 炎炎 火炎 火炎 类 类 类 
id: 4073 
change_type: new species 
scientific name: species 
english name: Prosobonia ellisi 
order: extinct; formerly Moorea (Society Islands) 
family: Charadriiformes 
类 火炎 淡 火 淡淡 火 炎炎 火炎 炎炎 火炎 火炎 火炎 火炎 火炎 炎炎 类 2 row 类 淡淡 淡 火 炎炎 火炎 淡 火 淡淡 火 火炎 火炎 类 火炎 火炎 类 火炎 类 
id: 6707 
change_type: new species 
scientific name: from the Arabian Peninsula 
english name: with range ""central AL Hajar mountains 
order: species 
family: Strix omanensis 





我 只 查 了 两 行 ， 不 过 你 可 以 去 掉 LIMIT 子 句 ， 查 出 所 有 行 。 总 共 应 该 是 11 行 。 这 里 显示 
的 两 行 就 来 自我 之 前 截取 Clements-Checklist-6.9-finalcsv 的 部 分 。 而 从 这 个 SELECT 可 以 发 





现 ， 数 据 导 入 得 不 太 对 。 为 了 看 得 更 清楚 ， 我 们 回 到 文件 中 ， 以 第 二 行为 例 : 


6707， 
new species, 
"Robb et al. (2013) describe a new species of owl, 
Omani Owl (Strix omanensis), 
from the Arabian Peninsula, 
with range ""central AL Hajar mountains, 
northern Oman"". Position Omani Owl immediately following 
Hume's Owl (Strix butleri).", 
species, 
Strix omanensis, 
Omani Owl, 
"central AL Hajar mountains, 
northern Oman", 
Strigiformes, 
Strigidae (Owls), 
,»,» addition (2014),,,,, 








这 里 ， 我 把 插入 列 中 的 文本 显示 成 粗 体 了 。 这 样 看 来 ， 似 乎 是 MySQL 被 域 中 的 逗号 迷惑 
了 。 因 为 我 们 指定 了 FIELDS TERMINATED BY '，'， 所 以 就 导致 了 含 逗 号 的 域 被 拆 分 ， 并 被 





填 到 后 续 的 列 中 。 要 想 解 决 这 个 问题 ， 可 以 在 FIELDS 子 句 中 增加 一 些 参数 来 判断 。 





让 我 们 先 清空 clements_list_import 表 ， 然 后 重新 导入 一 次 。 这 就 是 创建 临时 表 的 好 处 之 











一 ， 我 们 可 以 随时 清空 ， 从 头 再 来 。 使 用 以 下 两 条 语句 来 做 : 


DELETE FROM rookery.clements list import; 








LOAD DATA INFILE '/tmp/Clements-Checklist-6.9-final.csv' 
INTO TABLE rookery.clements_ list import 

FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' 
IGNORE 1 LINES; 


第 一 名 是 清 表 ， 以 便 重 导 。 而 第 二 名 与 之 前 的 LOAD DATA INFILE 差不多 ， 不 过 给 





FIELDS 


子 句 加 了 ENCLOSED BY 和 骨 套 子 句 ， 来 指定 域 用 的 是 双 引 号 。 另 外 ， 因 为 并 非 所 有 域 都 这 样 ， 
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所 以 我 们 还 要 在 这 个 贬 套 子 句 前 加 上 OPTIONALLY 选项 。 这 样 就 使 得 MySQL 在 遇 到 一 个 双 
引号 时 ， 会 往 后 寻找 另 一 个 ， 并 在 找到 时 ， 把 这 一 对 双 引 号 之 间 的 内 容 都 当成 数据 (即使 
其 中 含有 逗号 )。 

由 于 有 些 域 不 带 双 引号 ， 而 双 引 号 又 不 止 一 对 ， 你 可 能 会 觉得 应 该 很 难 分 辨 。 但 对 于 
MySQL 来 说 ， 这 根本 不 成 问题 。 


一 般 来 说 ， 正 在 导入 数据 的 表 是 被 锁定 的 ， 其 他 用 户 不 能 操作 它 。 但 其 实 ， 
可 以 带 上 LOW_PRIORITY 选项 ， 使 别人 能 读 取 该 表 ， 即 使 用 LOAD DATA LOW_ 
PRIORITY INFILE。 这 样 ， 导 入 数据 的 行为 就 会 等 到 疫 人 读 表 的 时 候 才 被 执 
行 。 此 选项 只 在 具有 表 级 锁 的 表 (存储 引擎 为 MyISAM) 上 生效 ， 而 在 行 级 
锁 的 表 (存储 引擎 为 InnoDB) 上 无 效 。 









































此 外 ， 我 还 在 末尾 加 了 IGNORE 子 句 ， 令 MySQL 忽略 我 所 指定 的 行 数 ( 从 文件 开头 算 起 )。 
因此 ， 第 一 行 的 表 头 就 不 会 被 导入 数据 库 了 。 如 果 表 头 不 止 一 行 ， 可 以 在 IGNORE 后 指定 相 
应 的 数字 。 
再 执行 一 次 之 前 的 SELECT : 

SELECT id, change_type, 

scientific_name, english_name, 

“order’*, fanmily 


FROM rookery.clements_list_ import 
WHERE change_type = 'new species' LIMIT 2 \G 








类 淡淡 火 火 火炎 火炎 淡 火 淡淡 火炎 淡淡 火炎 火炎 火炎 火 火 火炎 上 row 类 淡淡 火炎 火炎 淡淡 火 火 火炎 火炎 类 火 火炎 火炎 炎炎 火炎 炎炎 
id: 4073 
change_type: new species 
scientific name: Prosobonia ellisi 
english_name: Moorea Sandpiper 
order: Charadriiformes 
family: Scolopacidae (Sandpipers and Allies) 
类 淡淡 火 火 淡淡 火 淡淡 火 淡淡 火炎 淡淡 火炎 火炎 火炎 火炎 火炎 2 row 类 淡淡 火炎 火炎 淡淡 火 火炎 淡淡 火炎 火炎 类 火 火炎 炎炎 类 炎炎 
id: 6707 
change_type: new species 
scientific _ name: Strix omanensis 
english_name: Omani OwlL 
order: Strigiformes 
family: Strigidae (Owls) 


这 次 导入 正确 了 ， 学 名 和 俗名 所 在 的 列 ， 以 及 我 们 需要 的 其 他 列 都 对 上 了 。 现 在 可 以 进行 
下 一 步 了 。 


15.2.3 选取 导入 的 数据 


既然 我 们 已 经 把 康 奈 尔 大 学 的 数据 文本 正确 地 导入 clements_list_import 表 ， 那 就 可 以 用 
INSERT INTO.. .SELECT 将 该 表 的 数据 复制 到 birds 表 中 了 。 因 为 我 们 现在 还 在 学 习 和 实验 
阶段 ， 所 以 先 来 创建 一 个 结构 如 同 birds 的 表 ， 容 纳 来 自 clements_list_import 的 数据 。 
建 表 语句 如 下 : 
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CREATE TABLE rookery.birds_new 
LIKE rookery.birds; 


接着 ， 从 clements_list_import 表 中 选取 我 们 需要 的 行 ， 插入 birds_new 表 。 在 服务 器 上 
执行 以 下 命令 : 


INSERT INTO birds_new 
(scientific name, common_name, family_id) 
SELECT clements.scientific name, english name, bird families.family_id 
FROM clements_list import AS clements 
JOIN bird families 
ON bird families.scientific name = 
SUBSTRING(family, 1, LOCATE(' (', family) ) 
WHERE change_type = 'new species'; 


这 里 只 取 了 clements_list_import 表 的 两 列 来 插入 ( 即 scientific_name 和 english_ 
nane)。 而 family_id 则 通过 将 clements_list_import 与 bird_families 连接 而 查 得 。 为 了 
确定 family_id， 我 们 需要 用 科 名 来 做 连接 。 虽 然 clements_list_import 表 中 有 family 列 ， 
但 它 的 科 名 中 还 包含 了 多 余 的 文字 (该 科 中 一 些 鸟 的 俗名 )。 所 以 ， 需 要 用 LOCATE() 来 
查 出 该 科 名 中 空格 后 接 一 个 左 括号 的 位 置 ， 然 后 用 SUBSTRING() 把 该 位 置 前 的 文字 截取 出 
来 当 作 科 名 (例如 ， 从 Strigidae (Owls) 中 截 出 Strigidae)。 而 为 了 筛选 出 新 鸟 种 ， 我 们 在 
WHERE 中 限定 只 查 出 change_type 为 new species 的 行 。 


来 看 看 这 个 INSERT INTO.. .SELECT 效果 如 何 : 


SELECT birds_new.scientific_name, 
common_name, family_id, 
bird_families.scientific name AS family 
FROM birds_new 

JOIN bird_families USING(family_id); 




















+------------------------ +--------------------- +----------- +--------------- + 
| scientific_ name | common_name | family_id | family | 
+------------------------ +--------------------- +----------- +--------------- + 
| Prosobonia ellisi | Moorea Sandpiper | 164 | Scolopacidae | 
| Strix omanensis | Omani OwL | 178 | Strigidae | 
| Batrachostomus chaseni | Palawan Frogmouth | 180 | Podargidae | 
| Erythropitta yairocho | SuLu Pitta | 217 | Pittidae | 
| Cichlocolaptes maza... | Cryptic Treehunter | 223 | Furnariidae | 
| Pomarea nukuhivae | Nuku Hiva Monarch | 262 | Monarchidae | 
| Pomarea mira | Ua Pou Monarch | 262 | Monarchidae | 
| Pnoepyga mutica | Chinese Cupwing | 285 | Pnoepygidae | 
| Robsonius thompsoni | Sierra Madre Gro... | 290 | Locustellidae | 
| Zoothera atrigena | Bougainville Thrush | 303 | Turdidae | 
| Sporophila beltoni | Tropeiro Seedeater | 322 | Thraupidae | 
+------------------------ +--------------------- +----------- +--------------- + 


看 起 来 不 错 。11 行 新 乌 种 都 在 了 ， 而 且 科 名 也 对 应 。 接 下 来 只 需 再 用 INSERT 
INTO.. .SELECT 把 birds_new 表 的 数据 复制 到 birds 表 中 即 可 。 


尽管 这 个 CSV 文件 中 有 大 量 的 数据 ， 但 导入 起 来 并 不 困难 。 如 果 你 想 导 入 得 更 加 顺畅 ， 可 
以 在 不 同 的 情况 中 ,使 用 其 他 不 同 的 子 句 、 欣 套子 句 和 选项 。 接 下 来 的 几 市 就 来 介绍 它们 。 
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15.3 更 好 地 导入 


尽管 我 们 已 经 成 功 地 导入 了 一 个 大 文件 ， 但 其 实 可 以 做 得 更 好 。 所 以 ， 本 市 将 会 介绍 如 何 
更 好 地 使 用 LOAD DATA INFILE。 


15.3.1 ”对 应 域 


在 之 前 的 导入 中 ， 为 了 排除 那些 我 们 不 想 要 的 域 ， 我 们 给 这 些 域 创建 了 长 度 为 零 的 字符 型 
列 ， 并 且 ， 对 于 由 此 而 产生 的 大 量 警 告 ， 我 们 选择 了 不 去 理会 。 


但 其 实 ， 有 更 好 的 方法 来 过 滤 掉 那些 不 想 要 的 域 。 可 以 在 LOAD DATA INFILE 的 末尾 ， 以 去 
号 分 隔 的 方式 ， 给 出 一 些 列 名 或 用 户 自 定义 变量 。 这 些 列 名 和 变量 的 数量 必须 与 文件 中 域 
的 数量 一 致 ， 而 且 ， 列 名 应 该 与 其 该 存储 的 域 对 应 起 来 ， 按 文件 中 域 的 排序 来 写 。 即 使 该 
排序 与 表 结 构 的 排序 不 一 样 ， 也 无 所 谓 ， 即 表 结 构 不 必 与 文件 一 致 。 而 对 于 不 想 要 的 域 ， 
可 以 用 临时 变量 来 对 应 ， 并 任 由 这 些 变量 的 值 在 导入 过 程 中 被 反复 改写 。 最 后 ， 你 也 不 必 
里 会 它们 ， 因 为 临时 变量 会 在 连接 断 开 时 被 清除 。 

现在 ， 先 删除 clements_list_import 表 ， 并 重建 一 个 不 带 那些 无 用 列 的 表 。 顺 便 修 改 列 的 
顺序 。 做 法 如 下 : 


DROP TABLE rookery.clements_list import; 
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CREATE TABLE rookery.clements_list import 

(id INT, scientific_ name VARCHAR(255), 

english_name VARCHAR(255), family VARCHAR(255), 
bird_order VARCHAR(255), change_type VARCHAR(255)); 


于 是 ， 这 个 导入 数据 的 表 就 只 包含 我 们 想 要 的 列 了 。 其 中 ，family 在 bird_order 之 前 ， 而 


最 后 是 change_type。 


接着 ， 再 次 导入 数据 。 这 次 带 上 一 堆 列 名 和 变量 ， 分 别 与 想 要 的 和 不 想 要 的 域 对 应 起 来 。 
那些 不 想 要 的 域 会 被 导入 临时 变量 eniente。niente 在 意大利 语 中 是 “无 ”的 意思 。 其 实 
变量 的 命名 可 随意 。 现 在 ， 执 行 以 下 SQL 语句 : 


LOAD DATA INFILE '/tmp/Clements-Checklist-6.9-final.csv' 
INTO TABLE rookery.clements_list_import 

FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' 
IGNORE 1 LINES 

(id, change_type, @niente, @niente, 

scientific_name, english_nanme, 

@niente, bird_order, family, @niente, 

@niente, @niente, @niente, @niente, 

@niente, @niente, @niente, @niente); 

















Query OK, 32180 rows affected (0.66 sec) 
Records: 32180 Deleted: 0 Skipped: 0 Warnings: 0 


注意 ， 列 名 和 变量 的 排序 需要 与 CSV 文件 的 域 对 应 。 即 使 最 后 顺序 与 表 结构 不 一 样 
MySQL 也 会 帮 你 处 理 好 。 而 那些 不 想 要 的 域 则 被 导入 了 临时 变量 @niente， 这 使 得 每 次 读 
到 下 一 个 域 时 ， 该 变量 的 值 都 会 改变 。 导 入 过 程 很 顺利 ， 没 有 任何 警告 。 现 在 ， 让 我 们 选 











248 | 第 15 章 


取 表 中 最 后 的 两 个 新 鸟 种 ， 看 看 结果 如 何 : 


SELECT * FROM rookery.clements_list import 
WHERE change_type= 'new species' 
ORDER BY id DESC LIMIT 2 \G 


类 火 炎炎 火炎 淡 火 炎炎 火炎 炎炎 火炎 火炎 火炎 炎炎 火炎 火炎 大 十。 
id: 

scientific name: 
english_name: 
family: 
bird_order: 
change_type: 

类 火炎 淡 火 炎炎 火炎 类 淡淡 尖 火炎 火炎 火炎 炎炎 火 火 火炎 火炎 2, 
id: 

scientific name: 
english_name: 
family: 
bird_order: 
change_type: 


row 类 淡淡 淡 火 淡淡 火炎 类 火炎 淡淡 火 尖 淡 火 炎炎 火炎 火炎 炎炎 类 
30193 

Sporophila beltoni 

Tropeiro Seedeater 

Thraupidae (Tanagers and Allies) 
Passeriformes 

new species 

row 类 淡淡 淡 火 淡淡 火炎 类 火 火炎 火炎 类 淡 火 类 火 火 类 火炎 类 类 类 
26879 

Zoothera atrigena 

Bougainville Thrush 

Turdidae (Thrushes and Allies) 

Passeriformes 

new species 





如 果 你 用 的 文件 与 我 的 不 同 ， 那 么 可 能 不 是 这 样 的 结果 。 无 论 如 何 ， 从 这 里 可 以 发 现 ， 数 


据 能 被 导入 正确 的 列 。 接 下 来 ， 
birds_new 表 中 ， 再 到 birds 表 中 。 如 果 你 对 自己 输入 数据 的 能 力 有 信心 ， 
制 到 birds 表 中 。 现 在 这 种 做 法 已 经 比 上 次 好 多 了 ， 但 仍 有 改进 空间 。 下 夯 





只 要 运行 INSERT INT0...SELECT， 就 能 将 新 鸟 种 复制 到 
也 可 以 直接 复 
我 们 再 导 一 次 ， 




















不 过 这 次 要 去 掉 family 列 中 的 俗名 。 


15.3.2 

















设置 列 


如 果 你 想 在 把 数据 导入 表 的 列 之 前 ， 先 处 理 数据 ， 可 以 在 LOAD DATA INFILE 中 用 SET 子 
句 。 在 之 前 的 例子 中 ， 我 们 在 INSERT INTO...SELECT 中 用 了 SUBSTRING() 来 去 除 clements_ 


list_import 表 的 family 列 中 的 描述 〈 用 括号 括 起 来 的 俗名 )。 下 本 


清除 描述 。 用 下 面 这 两 条 语句 来 删除 并 重 导 数据 : 


再 月 














i 我 们 尝试 在 导入 数据 时 

















DELETE FROM rookery.clements_ list import; 


LOAD DATA INFILE '/tmp/Clements-Checklist-6.9-final.csv’' 
INTO TABLE rookery.clements_ list import 
FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' 


IGNORE 1 LINES 


(id, change_type, @niente, @niente, 


scientific_name, 


english_name, 


@nNniente, bird_ order, @family, @niente, 

@niente, @niente, @niente, @niente, 

@niente, @niente, @niente, @niente, @niente) 

SET family = SUBSTRING(@family, 1, LOCATE(' (', @family) ); 


这 与 之 前 的 LOAD DATA INFILE 差不多 ,但 这 次 我 们 先 把 科 名 存 到 了 @family 变量 中 ， 然 后 





日 SUBSTRING() 抽取 @family 中 的 子 字符 串 ， 最 后 用 SET 子 句 将 该 返 








回 值 存 入 family 列 。 





可 以 用 Treehunter 这 个 新 鸟 种 为 例 ， 看 看 结果 如 何 : 








tr 
SS 
wl 
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SELECT * FROM rookery.cLements_LiLst_import 
WHERE change_type= 'new species' 
AND english_name LIKE '%Treehunter%' \G 


类 淡淡 火 火 淡淡 类 尖 类 淡淡 火 火 火 火炎 大 大洲 炎 火炎 火炎 火炎 a row 类 淡淡 炎炎 淡淡 淡淡 火 火炎 火炎 六 炎炎 火炎 火炎 类 类 炎炎 炎炎 


id: 13864 
scientific name: Cichlocolaptes mazarbarnetti 
english name: Cryptic Treehunter 
family: Furnariidae 
bird_order: Passeriformes 
change_type: new species 


很 明显 ， 数 据 都 在 正确 的 列 中 ， 而 且 ，family 中 鸟 的 俗名 没有 了 。 如 果 需 要 的 话 ， 你 现在 
就 可 以 再 次 用 INSERT INT0.. .SELECT 将 新 鸟 种 的 数据 复制 到 btrds 表 中 。 


15.4 其 他 格式 的 域 和 行 


数据 文件 的 结构 可 能 多 种 多 样 ， 并 不 一 定 都 如 上 例 中 使 用 的 康 奈 尔 大 学 的 CSV 文件 那样 。 
有 一 些 文件 的 域 和 行 的 格式 不 一 样 。 所 以 ， 我 们 还 应 导入 一 个 不 同 的 数据 文件 ， 学 习 一 下 
用 LOAD DATA INFILE 语句 来 定义 各 种 域 和 行 的 其 他 方法 。 


接 下 来 的 例子 有 点 像 10.2 节 中 的 例子 。 当 时 ， 和 营销 人 员 给 我 们 的 是 一 个 dump 文件 ， 而 这 
次 ， 假 设 他 们 给 的 是 一 个 叫 birdwatcher-prospects.csv 的 数据 文件 。 它 包含 Rookery 网 站 的 
潜在 用 户 的 姓名 和 邮件 地 址 。 你 可 以 从 MySQL 资源 站 (http://mysqlresources.com/files) 下 
载 这 个 文件 的 副本 。 该 文件 的 头 几 行 如 下 : 

["prospect name"|"prospect email"|"prospect country"] 

["Mr. Bogdan Kecman"|"bodgan\@kecman-birds.com"|"Serbia"] 

["Ms. Sveta Smirnova"|"bettasveta\@gmail.com"|"Russia"] 


["Mr. Collin Charles"|"callincollin\@gmail.com"|"Malaysia"] 
["Ms. Sveta A. Smirnova"|"bettasveta\@gmail.com"|"Russia"] 


威 的 名 字 在 第 一 行 。 每 行 都 以 左 中 括号 开头 ， 并 以 右 中 括号 结尾 。 每 个 域 都 有 双 引 号 包 
围 ， 而 域 之 间 还 有 坚 线 分 隔 。@ 前 的 反 斜 杠 是 跳 脱 符 号 ， 用 于 说 明 其 后 的 字符 应 按 字 面 
意思 来 理解 。 若 要 导入 这 样 的 文件 ， 需 要 告知 MySQL 应 如 何 识别 行头 、 行 尾 ， 以 及 跳 
脱 符号 。 


15.4.1 开始 、 结 束 和 跳 脱 


导入 birdwatcher-prospects.csv 文件 前 ， 先 建 好 容纳 数据 的 表 。 该 表 除 了 要 有 与 原文 件 三 域 
对 应 的 三 列 ， 还 应 加 一 个 自 增 列 作为 主键 。 而 因为 邮件 地 址 通常 是 每 个 人 独 有 的 ， 所 以 该 
列 应 设 为 UNIQUE。 建 表 语 句 如 下 : 


CREATE TABLE birdwatchers.birdwatcher_prospects_import 
(prospect_id INT AUTO_INCREMENT KEY, 

prospect_name VARCHAR(255), 

prospect_email VARCHAR(255) UNIQUE, 

prospect_country VARCHAR(255)); 




























































































建 好 之 后 ， 就 可 以 从 birdwatcher-prospects.csv 导入 数据 了 。 执 行 以 下 语句 : 


LOAD DATA INFILE '/tmp/birdwatcher-prospects.csv 

INTO TABLE birdwatchers.birdwatcher_prospects_import 
FIELDS TERMINATED BY '|' ENCLOSED BY '"' ESCAPED BY "NAN'， 
LINES STARTING BY '[' TERMINATED BY ']\r\n' 

IGNORE 1 LINES 

(prospect_name, prospect_ email, prospect_country); 


虽然 以 上 语句 是 正确 的 ， 但 如 果 加 载 birdwatcher-prospects.csv， 它 就 会 报错 ， 导 入 不 了 数 

据 。 我 们 会 在 下 一 小 节 处 理 这 个 错误 。 现 在 ， 先 关注 一 下 LOAD DATA INFILE 中 FIELDS 和 

LINES 子 名 的 和 衣 套 子 句 。 

首先 ， 看 看 FIELDS 子 句 。 

。 TERMINATED BY 的 意思 是 ， 域 是 以 紧 线 结尾 的 。 虽 然 最 后 一 个 域 的 后 面 没 有 竖 线 ， 但 因 
为 我 们 指定 了 行 的 结束 符号 ， 所 以 MySQL 也 能 确定 每 行 最 后 一 个 域 在 哪里 结束 。 

。 ENCLOSED BY 的 意思 是 ， 每 个 域 都 被 放 在 双 引 号 中 。 

。 ESCAPED BY 用 于 指定 跳 脱 符号 。 其 实 默认 就 是 反 斜 枉 ， 所 以 对 于 这 份 文件 ， 我 们 不 需要 

带 这 个 碰 套 子 句 。 我 写 出 来 只 是 想 让 你 知道 有 这 回 事 。 

接着 ， 看 看 LINES 子 句 。 

。 STARTING BY 的 意思 是 ， 行 以 左 中 括号 开头 。 

。 TERMINATED BY 指定 了 行 由 右 中 括号 、 回 车 和 换行 符 结尾 。 通 常 ， 回 车 是 不 需要 的 ,但 

因为 这 份 文件 是 由 Windows 上 以 这 种 方式 结尾 的 软件 所 产生 的 ， 所 以 我 们 得 这 么 写 。 


15.4.2 ”替换 数据 或 忽略 错误 
现在 ， 我 们 来 处 理 上 一 小 节 中 LOAD DATA INFILE 所 报 的 错 。 在 我 们 运行 SQL 语句 时 出 现 
了 如 下 报错 信息 : 


ERROR 1062: Duplicate entry 'bettasveta@gmail.com' for key 'prospect email' 


报错 的 原因 是 ， 文 件 中 有 两 行 邮件 地 址 相同 (都 是 Sveta Smirnova 的 邮件 地 址 )， 但 
prospect_email 列 已 被 设 为 UNIQUE。 于 是 ， 这 就 导致 了 整个 导入 都 被 回 深 ， 最 终 没 有 数据 
能 进入 表 中 。 

对 于 这 种 问题 ， 有 几 种 处 理 方法 。 例 如 ， 我 们 可 以 修改 prospect_email 列 的 UNIQUE 设置 ， 
从 而 允许 邮件 地 址 重复 。 也 可 以 让 MySQL 忽略 这 样 的 错误 。 要 做 到 这 一 点 ， 可 以 给 LOAD 
DATA INFILE 加 上 IGNORE 选项 ， 如 下 所 示 : 
















































































LOAD DATA INFILE '/tmp/birdwatcher-prospects.csv' 

IGNORE INTO TABLE birdwatchers.birdwatcher_prospects_import 
FIELDS TERMINATED BY '|' ENCLOSED BY '"' ESCAPED BY '\\' 
LINES STARTING BY '[' TERMINATED BY ']\r\n' 

IGNORE 1 LINES 

(prospect_name, prospect_email, prospect_country); 


Query OK, 4 rows affected, 1 warning (0.02 sec) 





= 
Ea 
el 
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Records: 5 Deleted: 0 Skipped: 1 Warnings: 1 


SHOW WARNINGS \G 


类 淡淡 火 火 淡淡 类 尖 类 淡淡 火 火 火 火炎 大 汪汪 火炎 火 火 火炎 类 二 < row 类 淡淡 炎炎 淡淡 淡淡 火 火炎 炎炎 类 炎炎 火炎 火炎 类 类 大业 炎炎 


Level: Warning 
Code: 1062 
Message: Duplicate entry 'bettasveta@gmail.com' for key 'prospect email' 


运行 起 来 很 顺利 。 注 意 返 回信 息 ， 它 说 有 一 行 被 跳 过 了 ， 还 产生 了 一 个 警告 。 而 这 个 警告 
则 是 说 ， 有 重复 记录 。 > 即 SeEESUiiniva 的 世 二 全 得 归 
现在 用 SELECT 来 看 看 Sveta Smirnova 的 那 行 : 


SELECT * FROM birdwatchers.birdwatcher_prospects_import 
WHERE prospect_name LIKE '%Sveta%' NG 








炎 兴 兴 火炎 类 炎 炎炎 火炎 类 类 火炎 类 类 炎炎 类 炎炎 大 火炎 大 大 bs row 类 淡淡 炎炎 淡淡 淡淡 火炎 火炎 炎炎 淡淡 火炎 火炎 类 炎炎 火炎 火 


prospect_id: 16 
prospect_name: Ms. Sveta Smirnova 
prospect_email: bettasveta@gmail.com 
prospect_country: Russia 


结果 显示 ， 文 件 中 Sveta Smirnova 的 第 一 条 记录 被 插入 表 中 了 ， 而 第 二 条 则 没有 ， 因 为 
第 二 条 的 名 字 带 有 中 间 名 首 字 母 ， 很 明显 这 里 不 是 。 如 果 你 想 插 入 第 二 条 ， 那 么 可 以 把 
IGNORE 换 成 REPLACE: 





LOAD DATA INFILE '/tmp/birdwatcher-prospects.csv' 

REPLACE INTO TABLE birdwatchers.birdwatcher_prospects_import 
FIELDS TERMINATED BY '|' ENCLOSED BY '"' ESCAPED BY '\\' 
LINES STARTING BY '[' TERMINATED BY ']\n' 

IGNORE 1 LINES 

(prospect_name, prospect_email, prospect_country); 


Query OK, 6 rows affected (0.02 sec) 
Records: 5 Deleted: 1 Skipped: 0 Warnings: 0 


SELECT * FROM birdwatchers.birdwatcher_prospects_import 
WHERE prospect_name LIKE '%Sveta%' \G 


类 淡淡 淡 火 火炎 火炎 类 火炎 淡淡 火 尖 淡 火 炎炎 火炎 火 火 火炎 类 bk row 类 淡淡 火炎 火 火 炎炎 火炎 类 火炎 类 火炎 火炎 火炎 火炎 炎炎 火炎 
prospect_id: 26 
prospect_ name: Ms. Sveta A. Smirnova 
prospect_email: bettasveta@gmail.com 
prospect_country: Russia 


返回 信息 说 跳 过 的 有 0 行 ， 删除 的 有 1 行 。 这 是 因为 Sveta Smirnova 的 第 二 条 记录 把 第 一 
条 替换 了 。 从 SELECT 的 结果 可 以 看 出 ， 现 在 只 留 下 了 带 有 中 间 名 首 字母 的 那 条 记录 。 


15.5 在 MySQL 之 外 导入 数据 


至 今 我 们 介绍 的 导入 方法 都 是 在 MySQL 中 操作 的 。 其 实 ， 不 登录 MySQL 也 可 以 导入 数 
据 。 至少， 你 可 以 用 mysql 的 --execute 选项 执行 LOAD DATA INFILE， 也 可 以 用 另 一 个 专 
































门 导 入 数据 的 工具 ， 即 mnysqLimport。 本 节 就 来 介绍 它 。 与 LOAD DATA INFILE 一 样 ， 它 需 
要 账号 有 FILE 权限 。 但 是 如 果 你 没有 FILE 权限 ， 也 有 其 他 方法 。 现 在 ， 我 们 先 谈 谈 如 何 
不 上 传 到 服务 器 ， 而 直接 导入 本 地 文件 。 


15.5.1 导入 本 地 文件 


即使 你 没有 权限 将 文件 上 传 到 服务 器 ， 也 可 以 直接 通过 mysql 来 导入 数据 。 有 具体 做 法 就 是 
加 上 LOCAL 选项 。 无 需 先 登录 服务 器 再 以 localhost 的 方式 开启 mysql 客户 端 ， 相 反 ， 在 本 
地 计算 机 上 用 类 似 以 下 的 命令 来 进行 本 地 登录 : 
mysql --user=admin_import --password \ 
--host=mysqlresources.com --database=rookery 


通过 本 地 客户 端 建立 好 连接 后 ， 就 可 以 用 如 下 语句 来 导入 了 : 


LOAD DATA LOCAL INFILE '/tmp/birdwatcher-prospects.csv 
REPLACE INTO TABLE birdwatchers.birdwatcher_prospects_import 
FIELDS TERMINATED BY '|' ENCLOSED BY '"' ESCAPED BY '\\' 
LINES STARTING BY '[' TERMINATED BY ']\n' 

IGNORE 1 LINES 

(prospect_name, prospect_ email, prospect_country); 


基本 上 ， 这 会 使 客户 端 读 取 该 文件 ， 并 发 送 给 服务 器 ， 而 服务 器 则 会 将 这 些 内 容 暂 存在 操 
作 系 统 的 临时 目录 中 (比如 /tmp)。 

这 种 做 法 需要 服务 器 和 客户 端 都 接受 LOCAL 选项 ， 即 需要 有 人 在 两 边 的 配置 文件 中 都 设置 
local-infile=1。 另 外 ， 登 录 的 用 户 账号 必须 要 有 FILE 权限 。 虽 然 它 通常 不 会 被 授予 一 般 
的 用 户 ， 但 如 果 那 个 服务 器 是 你 的 ， 那 么 大 可 以 这 样 授权 。 授 权 问题 可 参考 第 13 章 。 











15.5.2 ”使 用 mysqlimport 


如 果 你 收 到 的 数据 文件 都 有 同样 的 格式 ， 那 么 写 一 个 简单 的 shell 脚本 ， 让 它 自动 将 数据 导 
入 MySQL 应 该 会 很 方便 。 对 于 这 种 自动 导入 的 任务 ， 可 以 使 用 mysqLimport 来 做 。 它 会 
按 指定 的 选项 来 执行 LOAD DATA INFILE。 

以 之 前 的 birdwatcher-prospects.csv 为 例 ， 来 演示 这 个 工具 的 用 法 。mysqlimport 要 求 文件 
名 和 表 名 一 致 ， 所 以 ， 我 们 要 把 文件 改名 为 birdwatcher_prospects.csv。 稍 后 我 会 再 解释 为 
什么 。 现 在 ， 先 试 着 在 服务 器 的 命令 行 中 执行 以 下 命令 : 











mysqlimport -user='marie dyer' --password='sevenangels' \ 
--replace --low-priority --ignore-lines='1' \ 
--fields-enclosed-by='"' --fields-terminated-by='|' --fields-escaped-by='\\'" \ 


--lines-terminated-by=']\r\n' \ 
--Columns='prospect_name, prospect email, prospect country' \ 
birdwatchers '/tmp/birdwatcher_prospects_import.csv' 


如 你 所 见 ， 所 有 的 选项 与 LOAD DATA INFILE 的 一 样 ， 只 是 变 成 了 小 写 ， 并 以 两 个 横 杠 开 
头 。 选 项 的 顺序 是 没有 规定 的 ， 但 数据 库 名 和 文件 名 要 放 在 命令 的 最 后 。 文 件 名 可 以 有 多 
个 ， 用 空格 将 它们 分 开 ， 然 后 mysqtimport 会 按照 你 给 的 顺序 来 导入 它们 。 
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文件 名 的 前 绥 必 须 与 表 名 一 样 ， 句 点 及 文件 扩展 名 不 算 。mysqLimport 就 是 这 样 依据 文件 
名 来 决定 将 数据 导入 哪个 表 的 。 因 为 表 名 不 能 带 有 横 杠 (MySQL 可 能 会 将 横 杠 当成 减 
号 )， 所 以 文件 名 也 要 相应 地 将 横 杠 改 成 下 划 线 。 

mysqlimport 的 运作 就 如 同 LOAD DATA INFILE， 而 事实 上 ， 它 在 内 部 调用 的 正 是 LOAD DATA 
INFILE。 有 了 这 个 工具 ， 你 就 可 以 将 导入 命令 写 在 shell 脚本 中 ， 或 者 让 命令 作为 crontab 
的 一 条 ， 使 mysqlimport 能 定期 自动 导入 你 不 断 更 替 的 数据 文件 。 


你 可 能 已 发 现 上 例 中 没有 --Lines-starting-by 选 项 。 那 是 因为 
mysqlimport 确实 没有 这 个 选项 。 专 门 研究 MySQL 软件 的 著名 专家 Paul 
Dubois 在 2006 年 就 提出 过 这 个 问题 。 但 这 个 选项 至 今 仍然 没有 被 添加 。 这 
也 表明 ，mysqlimport 的 支持 很 乏力 。 事 实 上 ， 在 服务 器 上 测试 它 时 ， 我 发 
现 它 不 太 好 用 。 如 果 它 适用 于 你 的 环境 ， 那 当然 很 好 。 如 果 你 要 写 脚本 来 导 
入 数据 ， 不 妨 使 用 API 脚本 〈 见 第 16 章 ) 再 配合 LOAD DATA INFILE 来 做 。 
而 且 ， 大 多 数 脚 本 语言 都 能 做 各 种 文件 格式 的 转换 。 



























































15.5.3 没有 FILE 权 限 也 能 导入 数据 


因为 担心 安全 问题 ， 所 以 有 些 主机 托管 公司 会 通过 不 授予 FILE 权限 ， 令 你 无 法 使 用 LOAD 
DATA INFILE。 但 其 实 你 可 以 绕 过 它 ， 只 是 必须 要 完成 一 些 额外 的 步 又 。 


首先 ， 登录 你 有 FILE 权限 的 另 一 个 MySQL 服务 器 (可 以 是 你 的 个 人 计算 机 上 的 
MySQL)。 我 们 把 这 个 MySQL 叫 作 临时 环境 ， 而 把 最 终 要 导入 数据 的 MySQL 叫 作 正式 环 
境 。 在 临时 环境 中 ， 建 一 个 与 正式 环境 中 用 于 导入 数据 的 表 一 模 一 样 的 表 。 而 在 正式 环境 
中 ， 最 好 也 与 之 前 的 例子 一 样 ， 建 一 个 暂 存 数据 的 表 ， 而 不 是 直接 把 数据 导入 最 终 的 表 。 
两 边 都 建 好 后 ， 在 临时 环境 中 执行 LOAD DATA INFILE 导入 数据 。 

接着 ， 用 第 14 章 详细 介绍 过 的 mysqldump 在 临时 环境 中 把 该 表 的 数据 导出 。 记 得 加 上 
--tables 选项 ， 以 确保 只 导出 需要 导入 数据 的 表 〈 可 以 参考 14.1.5 节 )， 并 加 上 --no- 
create-info 选项 ， 使 dump 文件 不 含有 CREATE DATABASE 和 CREATE TABLE。 

创建 表 的 dump 文件 后 ， 把 它 上 传 到 正式 环境 。 在 正式 环境 中 ， 用 mysqt 将 这 个 dump 文 
件 导入 需要 导入 文件 的 表 〈 有 具体 做 法 可 以 参考 14.2 市 )。 最 后 ， 用 INSERT INTO.. .SELECT 
将 数据 复制 到 相应 的 表 中 。 

其 实 这 种 导入 数据 的 做 法 与 之 前 的 差不多 ， 只 是 多 了 这 样 几 个 步骤 : 在 临时 环境 中 加 载 数 
据 ， 并 用 mysqtdump 导出 dump 文件 ， 再 在 正式 环境 中 用 mysqt 将 dump 文件 导入 相应 的 
表 。 这 种 做 法 并 不 困难 ， 只 是 比较 费时 而 已 。 


15.6 ”批量 导出 数据 


到 现在 为 止 ， 本 章 讲 的 都 是 如 何 把 文本 文件 里 的 数据 批量 导入 MySQL 和 MariaDB。 但 某 
些 时 候 ， 可 能 会 有 人 要 你 反 过 来 做 : 从 MySQL 数据 库 中 将 数据 批量 导出 到 文本 文件 中 。 
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其 实 与 导入 相 比 ， 导 出 简单 得 多 ， 最 多 就 是 要 想 好 导出 成 什么 格式 。 


批量 导出 数据 的 最 简单 的 方法 ， 就 是 用 SELECT 并 带 上 INTO OUTFILE 子 句 。 它 运行 起 来 与 
LOAD DATA INFILE 差不多 ， 因 为 用 到 的 租 套 子 句 都 是 一 样 的 ， 只 是 一 个 导出 ,一 个 导入 。 
下 面 我 们 就 来 看 个 例子 。 


假设 现在 我 们 要 提供 rookery 中 Charadriiformes 目 (包含 Sea Gull 和 Plover) 的 鸟 种 列表 。 
我 们 要 导出 鸟 种 的 学 名 、 俗 名 ， 以 及 科 名 。 


先 在 临时 环境 中 试 试 。 首 先 ， 写 一 条 SELECT 语句 ， 确 保 导出 的 数据 符合 要 求 : 


SELECT birds.scientific_name, 

IFNULL(common_name, ''), 
bird_families.scientific name 

FROM rookery.birds 

JOIN rookery.bird families USING(family_id) 

JOIN rookery.bird_orders USING(order_id) 

WHERE bird_orders.scientific name = 'Charadriiformes' 
ORDER BY common_nName; 


因为 要 获取 特定 目的 鸟 种 的 名 字 及 其 科 名 ， 所 以 我 们 在 SELECT 中 用 了 JOIN ( 见 第 9 章 ) 
来 连接 rookery 中 那 三 个 主要 的 表 。 最 后 ， 我 们 还 加 上 了 ORDER BY 来 按 common_name 排 
序 。 而 因为 SELECT...INTO OUTFILE 通 常会 将 NULL 值 转 换 成 字母 N， 所 以 我 们 还 要 用 
IFNULL() 将 所 有 NULL 的 俗名 转换 成 空 字 符 串 。 这 个 SELECT 是 没 问题 的 。 如 果 你 在 服务 
器 上 试 试 ， 会 发 现 它 大 概 会 返回 718 行 。 

为 了 让 接收 文件 的 人 能 看 懂 每 个 域 代 表 什么 意思 ， 我 们 要 在 第 一 行 加 上 每 个 域 的 名 字 。 最 
简单 的 做 法 就 是 在 SELECT 后 紧 跟 一 堆 字 符 串 : 


SELECT 'scientific name','common name','family name'; 


这 些 名 字 不 需要 与 列 名 一 样 ， 也 不 需要 遵循 特别 的 规则 。 为 了 把 以 上 语句 加 到 导出 结果 
里 ， 我 们 用 UNION 来 拼接 两 个 SELECT (注意 ， 域 名 字 的 SELECT 要 打头 )。UNION 的 用 法 也 
在 第 9 章 讲 过 。 

测试 过 这 些 SELECT 之 后 ， 就 可 以 结合 它们 来 导出 数据 了 。 执 行 以 下 命令 : 


( SELECT 'scientific name','common name','family name' ) 
UNION 
( SELECT birds.scientific_name, 
IFNULL(common_name, ''), 
bird families.scientific name 
FROM rookery.birds 
JOIN rookery.bird_families USING(family_id) 
JOIN rookery.bird _ orders USING(order_id) 
WHERE bird_orders.scientific name = 'Charadriiformes' 
ORDER BY common_name 
INTO OUTFILE '/tmp/birds-list.csv' 
FIELDS ENCLOSED BY '"' TERMINATED BY '|' ESCAPED BY '\\' 
LINES TERMINATED BY '\n'); 


导出 应 该 是 能 成 功 的 。 讲 过 SELECT 的 部 分 后 ， 我 们 来 关注 第 二 个 SELECT 中 的 INTO 
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OUTFILE 子 句 。 首 先 要 注意 ， 我 们 指定 了 导出 的 路 径 是 /tmp。MySQL 一 般 只 能 往 它 能 访问 
的 目录 中 写 数据 ， 而 /tmp 就 是 服务 器 上 所 有 用 户 都 能 读 写 的 目录 之 一 。 还 要 注意 ， 这 里 的 
骨 套 子 句 是 放 在 文件 路 径 和 文件 名 后 面 的 ， 这 和 LOAD DATA INFILE 相反 。 不 过 ， 它 们 用 到 
的 伦 套 子 句 都 是 一 样 的 。 


我 们 指定 了 域 要 用 双 引 号 包围 ， 且 以 坚 线 分 隔 ， 并 设置 了 反 和 斜 杠 作 为 跳 脱 符号 。 因 为 
SELECT. . .INTO OUTFILE 没有 默认 的 跳 脱 符号 设置 ， 所 以 你 得 自己 加 上 ESCAPED BY。 而 这 里 
之 所 以 要 写 两 个 反 斜 枉 ， 是 因为 反 斜 杠 本 身 也 要 跳 脱 。 最 后 ， 设 置 \n 作为 每 行 的 结尾 。 


导出 的 文件 大 概 如 下 (我 只 截取 了 开头 几 行 ) : 


"scientific name" | "Common name"|"family name" 

"Charadrius vociferus"|"Killdeer"|"Charadriidae" 

"Charadrius montanus"|"Mountain Plover"|"Charadriidae" 
"Charadrius alexandrinus"|"Snowy Plover"|"Charadriidae" 
"Pluvialis squatarola"|"Black-bellied Plover"|"Charadriidae" 
"Pluvialis fulva"|"Pacific Golden Plover"|"Charadriidae" 
"Burhinus vermiculatus"|"Water Thick-knee"|"Burhinidae" 
"Burhinus oedicnemus"|"Eurasian Thick-knee"|"Burhinidae" 












































看 上 去 不 错 。 第 一 行 是 域 的 名 字 。 接 下 来 是 整理 好 格式 的 数据 。 这 样 十 分 有 利于 给 使 用 另 
一 种 数据 库 系 统 的 人 提供 数据 。 


15.7 小结 


尽管 你 可 能 很 少 用 得 上 LOAD DATA INFILE， 但 当 你 需要 使 用 它 时 ， 会 发 现 它 能 帮 你 节约 很 
多 时 间 。 它 使 批量 导入 数据 和 迁移 到 MySQL 和 MariaDB 变 得 轻松 简单 。 虽 然 数 据 文件 格 
式 多 样 ， 你 可 能 需要 尝试 好 几 次 才能 准确 导入 数据 ， 但 只 要 你 是 在 临时 的 表 上 操作 ， 就 可 
以 反复 导入 和 删除 数据 ， 而 不 影响 别人 ， 也 不 会 有 丢失 数据 的 风险 。 

而 SELECT...INTO OUTFILE 则 是 分 享 数据 的 绝 佳 工具 。 如 果 你 所 在 的 公司 有 向 其 他 公司 分 
享 数 据 的 习惯 ， 那 么 它 应 该 会 成 为 你 的 常用 工具 。 所 以 ， 你 至 少 应 该 熟悉 这 个 工具 ， 以 备 
不 时 之 需 。 


15.8 习题 


要 完成 本 章 的 习题 ， 需 要 先 从 MySQL 资源 站 (http://mysqlresources.com/files) 下 载 

employees.csv 和 birder-list.csv， 并 把 它们 复制 到 /tmp 或 其 他 MySQL 能 读 写 的 目录 里 。 

其 中 ，employees.csv 是 我 用 SELECT.. .INTO OUTFILE 把 employee 数据 库 导 出 而 生成 的 。 而 

这 个 巨大 的 样本 数据 库 则 是 由 MySQL 的 人 员 创 建 的 ， 可 供 免费 下 载 (https:Wlaunchpad.net/ 

test-db/) 。 

(1) 用 文本 编辑 器 打开 employees.csv， 看 看 它 是 怎样 的 格式 。 然 后 创建 一 个 与 之 匹配 的 需 
导入 数据 的 表 。 建 好 后 ， 用 LOAD DATA INFILE 把 CSV 文件 中 的 数据 导 进 表 里 。 
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(2) 用 文本 编辑 器 打开 birder-listcsv， 看 看 它 是 怎样 的 格式 。 你 会 发 现 它 包含 一 些 意 大 利 
人 人， 而 且 这 些 人 有 望 成 为 我 们 网 站 的 会 员 。 所 以 ， 在 birdwatchers 库 中 ， 创 建 一 个 
需要 导入 数据 的 表 ， 令 其 拥有 如 下 顺序 的 列 : id、formal_title、name_first、name_ 
last、country 和 email。 将 id 列 设 为 自 增 的 键 。 


构造 一 条 LOAD DATA INFILE 语句 ， 将 birder-list.csv 的 数据 导入 刚才 那个 表 。 记 得 要 指 
定 列 名 。formal_title 列 的 填写 ， 需 要 用 到 SET 子 句 。 因 为 意大利 的 女性 名 字 通 常 以 a 
结尾 ， 而 男性 名 字 通 常 以 o 结尾 (也 有 一 些 以 e 或 i 结尾 )， 所 以 ， 可 根据 此 规律 来 让 
MySQL 在 formal_title 中 填 Ms. 或 Mr.。 写 完 后 ,执行 LOAD DATA INFILE 导入 数据 。 


导入 完成 后 ， 用 SELECT 检查 数据 导入 得 是 否 正确 。 如 果 不 正确 ， 就 清空 表 里 的 数据 ， 
然后 重新 导入 ， 直 到 正确 为 止 。 只 要 成 功 导 入 了 ， 就 用 INSERT INTO...SELECT 将 这 些 名 
字 加 到 humans 表 中 。 


(3) 用 SELECT...INTO OUTFILE 把 birds 表 中 俗名 带 有 Least 的 岛 导出 到 一 个 叫 little-birds.csv 
的 文件 中 。 导 出 的 结果 需要 包含 鸟 种 的 俗名 、 学 名 ， 以 及 所 属 科 、 目 的 学 名 。 格 式 如 
下 : 域 要 用 双 引 号 包围 ， 域 之 间 用 喜 号 分 隔 ， 每 条 记录 以 分 号 结尾 ， 不 要 换行 〈 即 不 带 
\n 或 \r)。 如 无 意外 ， 这 会 使 CSV 文件 把 所 有 内 容 写 成 很 长 的 一 行 。 导 出 数据 后 ， 用 
文本 编辑 器 打开 该 文件 ， 确 认 数据 是 否 在 一 行 中 。 

(4 在 rookery 数据 库 中 ， 创 建 一 个 叫 作 birds_least 的 表 。 其 中 包含 四 列 : scientific_ 
成 的 little-birds.csv 导入 此 表 。 这 可 能 需要 一 点 技巧 。 如 果 导 和 不 成 功 ， 那 就 删除 表 中 
的 数据 ， 重 新 导入 ， 直 到 成 功 为 止 。 
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第 16 章 


应 用 编程 接口 





Ax 


所 谓 使 用 应 用 编程 接口 (Application Programming Interface，API)， 就 是 使 用 编程 语言 与 计 
算 机 软件 系统 进行 交互 。 它 的 优点 是 能 让 你 按 自己 的 需要 ， 打 造 个 性 化 的 用 户 界 面 。 大 型 
网 站 都 使 用 API 来 让 外 界 与 MySQL 和 MariaDB 数据 库 进行 交互 ， 这 样 用 户 便 不 需要 了 解 
他 们 正在 使 用 的 数据 库 ， 也 不 需要 懂 SQL 语句 。 

本 章 会 介绍 几 种 用 于 与 MySQL 和 MariaDB 交互 的 API， 以 便 令 你 能 编写 自 定 义 应 用 程序 
来 操作 数据 库 。 内 容 包 括 : C API、Perl DBI、PHP API、ConnectorPython 和 Ruby API。 
当然 ， 其 他 编程 语言 也 有 连接 MySQL 的 API， 本 章 讲 的 只 是 比较 流行 的 那些 。 以 上 每 种 
API 的 相关 小 节 ， 都 会 包含 基本 的 MySQL (或 MariaDB) 连接 教程 ， 也 会 介绍 如 何 使 用 
该 API 发 起 数据 库 查 询 。 

一 般 来 说 ， 掌 握 一 种 API 便 足 够 了 ， 可 能 你 也 想 跳 到 你 所 了 解 的 (或 你 所 用 的 ) 编程 语言 
的 那 一 节 。 我 就 比较 喜欢 Perl 和 Perl DBI。Perl 很 贴近 自然 语言 (比如 英语 和 意大利 语 )。 
而 如 果 你 没有 什么 特别 喜好 ， 只 想 学 习 一 种 API， 和 那么 可 以 试 试 PHP API， 它 带 有 很 多 用 
于 与 MySQL 交互 的 方法 ， 很 多 人 都 用 它 ， 而 且 确 实 很 容易 掌握 。 你 可 以 在 网 页 中 使 用 它 
的 代码 片段 ， 或 使 用 Wordpress 和 Drupal 之 类 的 内 容 管理 系统 。 

不 过 本 书 不 会 教 你 如 何 使 用 任何 一 种 编程 语言 ， 因 为 我 觉得 你 应 该 能 通过 其 他 书本 或 在 线 
资源 来 学 习 它 们 的 基本 用 法 。 我 们 只 会 涉及 用 这 些 语 言 来 连接 数据 库 的 基本 写法 。 

在 阅读 以 下 任何 一 节 之 前 ， 你 都 应 该 先 创建 示例 和 习题 所 需 的 API 用 户 账号 。 而 最 后 的 习 
题 没 有 特别 要 求 使 用 哪 种 API， 可 以 哪 种 顺手 就 用 哪 种 。 


16.1 创建 API 用 户 账号 


假设 我 们 编写 的 API 程序 最 终 是 开放 给 外 界 使 用 的 ， 那 么 ， 我 们 就 得 专门 创建 一 个 用 户 
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账号 (创建 用 户 账号 在 第 13 章 讲 过 )。 我 们 可 以 给 它 起 名 为 public_api， 并 只 授予 它 在 
rookery 和 birdwatchers 数据 库 中 的 SELECT 权限 。 执 行 以 下 命令 : 


CREATE USER "pubLitc_api'Q'LocaLhost 
IDENTIFIED BY "pwd_123 ' ; 


GRANT SELECT 
ON rookery.* 
TO "pubLic_api'Q@'LocaLhost ' ; 


GRANT SELECT 
ON birdwatchers .* 
TO "pubLic_api'Q@'LocaLhost ' ; 


这 就 创建 了 密码 为 pwd_123 的 用 户 账号 public_api@localhost。 你 可 以 设置 一 个 安全 性 更 高 
的 密码 。 这 个 账号 只 能 从 localhost 访问 两 个 数据 库 。 具 体 来 说 ， 它 只 能 执行 SELECT， 不 能 
删改 任何 数据 。 我 们 会 在 将 要 创建 的 API 程序 中 使 用 它 ， 这 些 API 程序 通过 公众 网 页 来 检 
索 数 据 。 

此 外 ， 对 于 我 们 将 要 编写 的 某 些 程序 来 说 ， 还 需要 一 个 管理 员 账 号 admin_members， 用 来 
管理 网 站 的 会 员 信息 。 我 们 用 以 下 语句 来 创建 这 个 账号 : 


CREATE USER 'admin_members'@'localhost'" 
IDENTIFIED BY 'doc_ killdeer 123'; 





























GRANT SELECT, UPDATE, DELETE 
ON birdwatchers.* 
TO ‘admin_ members'@'localhost'; 


这 个 管理 员 账 号 只 可 以 在 birdwatchers 数据 库 中 选取 、 更 新 和 删除 数据 。 其 实 我 们 主要 就 
是 用 它 来 操作 humans 表 ， 而 只 是 偶尔 用 它 来 操作 该 数据 库 中 的 其 他 表 。 因 为 它 与 rookery 
数据 库 无 关 ， 所 以 我 们 没 让 它 在 rookery 中 有 任何 权限 。 


16.2 CC API 


虽然 现在 C 语言 没有 像 以 前 那么 流行 了 ， 但 它 仍然 强大 。 事 实 上 ，MySQL 的 核心 软件 就 
是 用 C 写 的 ， 而 C API 也 是 MySQL 提供 的 。 本 节 就 来 简单 地 讲 讲 如 何 使 用 C 和 C API 来 
连接 和 查询 数据 库 ， 这 会 包括 一 些 需要 你 必 知 必 会 的 C API 的 基本 组 件 和 常规 写法 。 















































16.2.1 连接 MySQL 


使 用 C 与 MySQL 交互 时 ， 我 们 需要 先 准备 好 一 些 变量 ， 这 些 变量 会 在 数据 库 连 接 时 存储 
数据 ， 以 及 我 们 执行 查询 的 结果 。 然 后 ， 我 们 需要 连接 服务 器 。 为 了 简单 起 见 ， 我 们 会 引 
入 两 个 C 头 文件 : 带 有 基本 C 函数 和 变量 的 stdio.h， 以 及 带 有 MySQL 特定 函数 和 定义 的 
mysql.h (这 两 个 文件 分 别 来 自 C 和 MySQL 或 MariaDB ， 如 果 你 的 服务 器 有 C 和 MySQL， 
那 就 不 需要 另外 下 载 这 两 个 文件 )。 

#include <stdio.h> 

#include "/usr/include/mysql/mysql.h" 
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int main(int argc, char *argv[ ]) 
{ 

MYSQL *mysql; 

MYSQL_RES *result; 

MYSQL_ROW row; 


stdio.h 两 侧 的 < 和 >， 意 思 是 叫 C 到 默认 位 置 (如 /usr/include) 或 用 户 的 路 径 去 查找 C 头 
文件 。 而 因为 mysql.h 不 在 默认 位 置 ， 所 以 要 在 双 引 号 中 写 出 绝对 路 径 。 你 也 可 以 写成 
<mysql/mysql.h>， 因 为 C 头 文件 就 在 默认 位 置 的 子 目录 中 。 


然后 ， 在 main 函数 的 开头 ， 我 们 先 准 备用 于 连接 、 的 一 些 变 量 。 第 一 行 创建 了 一 个 
指针 ， 指 向 MysQL 结构 〈 它 存储 在 mysql 变量 中 )。 一 行 则 根据 mysql.h 提供 的 MYSQL_ 
RES 的 定义 ， 定 义 和 命 名 了 一 个 结果 集 。 0 result 数组 中 ， 它 将 是 一 个 包含 
行 的 数组 。 第 三 行使 用 MYSQL_ROW 的 定义 ， 创 建 了 行 变量 ， 后 面 会 用 来 保存 列 的 数组 。 


引入 了 头 文件 并 定义 了 变 量 之 后 ， 就 可 以 用 mysqL_init 在 内 存 中 创建 一 个 对 象 ， 用 来 与 
MySQL 服务 器 进行 交互 : 























if(mysql_init(mysql) == NULL) { 
fprintf(stderr, "Cannot Initialize MySQL"); 
return 1; 


3 





| 


这 里 的 if 语句 是 用 来 检查 能 不 能 初始 化 MySQL 对 象 。 如 果 初 始 化 失败 ， 就 会 打印 一 条 信 
息 ， 并 结束 程序 。mysql_init() 会 用 我 们 在 main 开头 定义 的 MYsQL 结构 来 初始 化 MySQL 
对 象 〈 起 名 为 nysql 只 是 习惯 而 已 )。 如 果 C 成 功 地 初始 化 对 象 ， 那 它 就 会 进行 下 一 步 ， 
尝试 连接 MySQL 服务 器 : 





if(!mysql_real_connect(mysql,"localhost", 
"public_api","pwd_123","rookery",0,NULL,0)) 

{ 
fprintf(stderr, "%d: %s \n", mysql_errno(mysql), mysql_error(mysql)); 
return 1; 


， 


从 此 例 你 应 该 很 容易 就 能 看 出 mysql_real_connect 需要 些 什么 参数 : MySQL 对 象 的 引用 、 
主机 名 或 二 地 址 、 用 户 名 和 密码 ， 以 及 所 要 操作 的 数据 库 。 而 此 例 用 的 账号 就 是 本 章 开 
头 创建 的 public_api@localhost。 剩 下 的 三 个 参数 是 端口 号 、 套 接 字 文件 的 名 字 和 客户 端 标 
识 。 如 果 你 没有 特别 要 求 ， 那 就 填 0 和 NULL， 让 mysql_real_connect 按 默认 的 设置 。 

如 果 程 序 无 法 连接 ， 那 它 就 会 把 服务 器 报 的 错 打印 到 标准 错误 流 ， 并 将 错误 号 和 错误 信息 
按 %d: %s \n 来 格式 化 。 其 中 错误 号 (%d) 可 从 mysqL_errno() 获取 ， 错 误 信 息 (%s) 则 可 
从 mysql_error() 获取 。 而 如 果 程 序 能 连接 ， 且 没有 报错 ， 那 么 mysql_real_connect 就 会 
返回 1 以 示 成 功 ， 我 们 就 可 以 进入 下 一 环节 。 
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16.2.2 ”查询 MySQL 
目前 ， 我 们 只 建立 好 了 连接 。 还 需要 看 看 如 何 通过 C API 来 执行 SQL 语句 。 


如 果 API 程 序 已 经 连接 MySQL， 那 它 就 可 以 用 查询 函数 (比如 mysqt_query()) 来 发 起 查 
询 。 以 下 便 是 用 SELECT 来 获取 birds 表 的 数据 ， 并 将 结果 展示 出 来 的 代码 : 




















if(mysql_query(mysql,"SELECT common_name, scientific name FROM birds")) { 
fprintf(stderr, "%d: %s\n", 
mysql_errno(mysql), mysql_error(mysql)); 


else { 
result = mysql_store_result(mysql); 
while(row = mysql_fetch row(result)){ 
printf("\%s - \%s \n", row[0], row[1]); 


mysql_free_result(result); 


mysql_close(mysql); 
return 0; 


} 


此 例 的 if 语句 用 了 mysql_query() 来 发 起 查询 ， 但 你 也 可 以 用 mysql_real_query()。 后 者 
能 获取 二 进 制 数据 ， 这 样 更 安全 。 不 过 这 个 例子 很 简单 ， 所 以 用 mysqL_query() 就 可 以 了 。 
这 个 函数 会 在 查询 成 功 时 返回 0， 失 败 时 返回 非 零 值 。 所 以 ， 如 果 失 败 ， 就 会 打印 出 错误 
信息 。 如 果 成 功 ， 返 回 的 0 就 会 使 程序 忽略 if， 而 执行 else 语句 块 。 


而 在 else 语句 块 中 ， 第 一 行 用 mysql_store_result() 将 查询 的 结果 集 存储 在 result 变 
量 中 。 


接着 ， 在 释放 数据 之 前 ， 用 while 循环 遍历 结果 集 的 每 一 行 。 这 里 用 到 了 mysql_fetch_ 
row()， 使 每 一 次 循环 查 到 的 行 都 暂 存 在 row 变量 中 。 因 为 我 们 能 预 估 到 这 个 SELECT 会 查 
出 些 什么 列 ， 所 以 可 以 直接 在 printf 中 定好 格式 来 展示 每 一 列 。 注 意 ， 抽 取 列 的 内 容 就 与 
抽取 数组 元 素 是 一 样 的 写法 〈 即 array [n])。 


而 作为 这 个 else 语句 块 的 收尾 ， 在 遍历 过 后 ， 我 们 会 用 mysql_free_result() 来 释放 
result 所 指 的 内 存 。 


最 后 ， 用 mysql_close() 来 断 开 与 MySQL 的 连接 ， 并 用 右 花 括号 来 结束 main。 


16.2.3 ”完整 的 最 小 C API 程 序 


像 我 刚才 那样 分 块 来 解释 程序 的 组 件 ， 听 起 来 会 容易 一 点 ， 但 可 能 不 利于 对 整体 布局 的 掌 
握 。 所 以 ， 下 面 我 再 给 出 完整 的 版 本 。 


#include <stdio.h> 
#include "/usr/include/mysql/mysql.h" 
int main(int argc, char *argv[ ]) 
{ 
MYSQL *mysql; 
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MYSQL_RES *result; 
MYSQL_ROW row; 


if(mysql_init(mysql) == NULL) { 
fprintf(stderr, "Cannot Initialize MySQL"); 
return 1; 


} 


if(!mysql_real_connect(mysql, "localhost", "public api", 
"pwd_123", "rookery", 0, NULL, 0)) { 
fprintf(stderr, "%d: %s \n", mysql_errno(mysql), mysql_error(mysql)); 
return 1; 


} 


if(mysql_query(mysql,"SELECT common_name, scientific name FROM birds")) { 
fprintf(stderr, "%d: %s\n", 
mysql_errno(mysql), mysql_error(mysql)); 


else { 
result = mysqL_store_resuLt(mysqL) ; 


while(row = mysql_fetch row(result)) { 
printf("\%s - \%s \n", row[0], row[1]); 


mysql_free_result(result); 


mysql_close(mysql); 
return 0; 


16.2.4 ”用 GNU C 编 译 器 编译 
你 可 以 用 任何 编译 器 来 编译 以 上 程序 ， 但 我 在 这 里 只 给 出 GNU C 编译 器 (gcc) 的 示例 。 
gcc 是 免费 软件 ， 很 多 系统 都 自 带 。 如 果 想 进行 编译 和 链接 ， 可 以 输入 如 下 命令 : 

gcc -Cc ‘mysql_config --cfLags” mysgql_c prog.c 

gcc -0 mysql_c prog mysql_c prog.o ‘mysql_config --libs. 
当 编 译 器 试图 编译 mysql_c_prog.c 时 ， 它 会 检查 代码 是 否 有 语法 错误 。 若 有 ， 它 会 停止 编 
译 并 报错 。 若 无 ， 则 会 准备 执行 生成 的 编译 程序 mysql_c_prog。 


16.3 Perl DBI 


用 Perl 来 连接 MySQL 的 最 简单 的 方法 ， 就 是 使 用 Perl DBI 模块 。 而 阅读 本 节 的 前 提 是 ， 
你 对 Perl 有 基本 的 了 解 。 我 们 只 会 关注 如 何在 Perl 程序 中 连接 MySQL、 执 行 SQL 语句 ， 
以 及 获取 数据 ， 并 不 会 谈 及 Perl 本 身 的 特性 。 这 意味 着 本 节 的 Perl DBI 入 门 讲解 是 专门 针 
对 Perl 程序 员 的 。 
本 节 的 示例 如 下 : 假设 我 们 想 给 管理 员 写 一 个 程序 ， 方 便 他 获取 会 员 信息 ， 并 更 改 其 中 某 
些 人 的 会 员 资格 失效 日 期 。 为 此 ， 我 们 会 用 专 为 管理 会 员 信息 而 设 的 admin_members 用 户 
账号 。 我 们 在 本 章 开 头 创建 过 此 账号 。 
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16.3.1 安装 
Perl DBI 是 Perl 核心 的 一 部 分 。 你 可 以 从 CPAN (http://www.cpan.org/) 下 载 Perl 和 DBI 
模块 。 
如 果 你 的 服务 器 上 已 安装 Perl (其 实 大 多 数 服务 器 都 安装 了 )， 那 么 可 以 用 以 下 命令 来 安装 
DBI: 

perl -MCPAN -e 'install DBI' 
如 果 没 有 安装 Perl， 可 以 使 用 安装 包 管 理工 具 ， 比 如 yum， 来 安装 DBI。 如 果 用 yun 的 话 ， 
需要 先 以 root 或 文件 系统 管理 员 账 号 登录 ， 然 后 执行 以 下 命令 。 


yum install perl perl-mysql 






































16.3.2 连接 MySQL 
若 想 与 MySQL 交互 ， 需 要 先 用 DBI 来 连接 它 。 连 接 过 程 很 简单 ， 就 是 用 以 下 几 行 代码 : 


#!/usr/bin/perl -w 
use strict; 








use DBI; 


my $user = 'admin members'; 

my S$password = 'doc_killdeer_123'; 
my $host = 'LocaLhost ' ; 

my $database = 'birdwatchers'; 


my $dbh = DBI->connect("DBI:mysql:$database:$host", $user, $password) 
|| die "Could not connect to database: " . DBI->errstr; 





头 两 行 启动 Perl， 并 设 为 严格 模式 ( 即 use strict)， 以 尽量 减少 出 错 。 下 一 行 调用 DBI 
模块 。 然 后 我 们 创建 与 登录 MySQL 相关 的 一 些 变量 。 在 后 面 被 拆 成 两 行 的 那 条 语句 中 ， 
这 些 变量 被 用 来 建立 MySQL 数据 库 连 接 。 歼 取 到 的 连接 ， 我 们 会 用 $dbh 指向 它 。 如 果 连 
接 失 败 ， 就 执行 die 部 分 。 如 有 果 成 功 ， 则 往 下 执行 。 


16.3.3 查询 MySQL 

只 连接 MySQL 是 没什么 用 的 ， 我 们 还 要 执行 SQL 语句 。 任 何 SQL 语句 都 可 以 通过 API 
来 执行 。 唯 一 要 考虑 的 是 ， 数 据 库 账号 本 身 是 否 有 权限 执行 SQL。 换 句 话说 ， 如 果 你 的 账 
号 只 能 执行 SELECT， 那 么 程序 就 只 能 执行 SELECT。 下 面 ， 我 们 就 来 看 看 如 何 通过 程序 在 
MySQL 中 查询 和 插入 数据 。 

1. 查询 数据 

紧 接 上 例 ， 让 我 们 用 SELECT 从 humans 表 中 获取 一 些 会 员 信 息 。 我 们 允许 这 个 Perl 程序 在 
命令 行 读 取 一 个 姓氏 ， 并 以 它 作 为 查询 条 件 。 例 如 ， 当 程序 的 使 用 者 输入 XXX 做 参数 时 ， 
程序 便 给 他 返回 姓 XXX 的 会 员 。 而 为 了 让 查询 更 灵活 ， 我 们 会 在 WHERE 子 句 中 用 LIKE。 
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大 概 就 是 这 样 : 
my $search_parameter = shift; 


my $sql_stmnt = "SELECT human_id, 
CONCAT(name_first, SPACE(1), name_last) AS fuLL_name， 
membership_expiration 
FROM humans 
WHERE name_last LIKE ?"; 


my $sth = $dbh->prepare($sql_stmnt); 


$sth->execute("%$search_parameter%"); 


首先 ， 我 们 通过 shift 来 获取 命令 行 参 数 ， 并 用 变量 $search_parameter 来 持 有 它 。 接 着 ， 
创建 存 有 SQL Se stmnt。 但 注意 ，WHERE 子 句 中 并 没有 指定 姓氏 ， 而 是 写 了 
一 个 问号 。 这 个 问号 其 实 是 一 个 占 位 符 ， 之 后 执行 语句 时 ， 我 们 才 会 给 它 代 入 实际 的 参 
数 。 使 用 占 位 符 是 一 0 有 具体 可 以 参考 16.7 节 。 


创建 了 $sql_stmnt 变量 之 后 ， 我 们 用 $dbh 的 prepare() 函数 ， 在 数据 库 构 建 这 个 查询 ， 
并 以 $sth 指向 构建 的 结果 。 最 后 ， 调 用 这 个 $sth 的 execute() 方法 ， 并 传递 $search_ 
parameter， 来 代入 占 位 符 的 位 置 。 如 果 要 替换 多 个 占 位 符 ， 可 以 在 execute() 中 以 有 逗 号 分 
隔 的 方式 列 出 对 应 的 实际 参数 。 


连接 MySQL 并 发 起 查询 之 后 ， 剩 下 要 做 的 就 是 取出 结果 集 的 数据 ， | 它们 展示 给 管 
里 员 。 我 们 可 以 在 while 循环 中 用 fetchrow_array() 这 个 一 次 获取 一 行 结果 的 函数 来 做 : 





























YH 











while(my($human_id,$full_name, $membership expiration) = $sth->fetchrow_array()) 


print "$full_name ($human_id) - $membership expiration \n"; 


} 


$sth->finish(); 
$dbh->disconnect(); 


只 要 结果 集 的 记录 未 被 取 尽 ，while 块 中 的 代码 就 会 被 反复 执行 。 在 这 里 ， 我 们 将 每 行 的 
两 列 数据 存 到 $common_name 和 $scientific_name 这 两 个 变量 中 (每 次 循环 都 会 重 写 这 些 变 
量 )， 然 后 将 它们 连同 换行 符 打印 出 来 。 


而 倒数 第 三 行 则 是 用 $sth 的 finish() 来 终结 这 个 构建 出 的 语句 。 最 后 一 行 用 $dbh 的 
disconnect() 来 断 开 数 据 库 连 接 。 当 然 ， A 继续 在 这 个 连接 上 创建 
并 执行 其 他 SQL 语句 。 


从 MySQL 中 获取 数据 的 一 个 更 好 的 做 法 ， 就 是 在 Perl 程序 ee 
使 用 ， 并 在 处 理 结果 前 关闭 MySQL 连接 。 打 开 MySQL 的 同时 逐 行 获取 数据 会 拖 慢 程序 ， 
这 在 数据 量 很 大 时 尤为 明显 。 因 此 ， 一 次 就 获取 所 有 行 ， a 
等 到 用 时 直接 从 该 数组 中 取 ， 可 能 会 更 高 效 。 具 体 的 做 法 就 是 用 fetchall_arrayref() 方 
法 。 它 会 给 你 构建 这 样 的 数组 ， 并 返回 该 数组 的 起 始 位 置 : 
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my $members = $sth->fetchall_arrayref(); 
$sth->finish(); 


foreach my $member (@$members){ 
my ($human_id, $full_name, $membership_expiration) = @$member; 
print "$full_name ($human_id) - $membership _ expiration \n"; 


} 


$dbh->disconnect(); 


fetchall_arrayref() 获取 所 有 行 ， 把 它们 保存 在 内 存 的 数组 中 ， 然 后 返回 它 的 起 始 位 置 。 
我 们 把 起 始 位 置 保存 在 $members 中 ， 然 后 用 foreach 循环 地 将 @$members 的 每 个 数组 赋 给 
Snember， 再 在 foreach 块 中 ， 把 $member 数组 的 元 素 分 别 赋 给 Shuman id、S$fuLL_name 和 
$membership_expiration。 接 着 用 print 将 它们 打印 出 来 。 

注意 ， 在 foreach 之 前 ， 我 们 就 已 经 调用 了 finish() 来 结束 这 个 查询 语句 ， 并 让 MySQL 释放 
资产。 如果 你 不 需要 做 其 他 查询 ， 那 么 甚至 可 以 在 finish() 之 后 立即 执行 disconnect()。 
这 对 后 面 的 foreach 是 没有 影响 的 ， 因 为 fetchall_arrayref() 已 将 所 有 结果 导出 。 

2. 更 新 数据 
我 们 已 经 在 前 面 的 例子 中 讲 了 如 何 从 表 中 查询 数据 ， 下 面 来 看 看 更 新 数据 的 例子 。 我 们 要 
修改 $sql_statement 的 内 容 ， 使 其 包含 UPDATE 语句， 用 来 更 新 humans 表 的 membership_ 
expiration 列 。 做 法 如 下 : 







































































my ($human_id, $membership_expiration) = (shift, shift); 


$sql_stmnt = "UPDATE humans 
SET membership_expiration = ? 
WHERE human id = ?2"; 


$sth = $dbh->prepare($sql_stmnt); 
$sth->execute($membership_ expiration,$human_id); 


先 使 用 shift 两 次 ， 将 用 户 输入 的 两 个 参数 放 到 $human_id 和 $membership_expiration 中 。 
然后 ， 编 写 一 条 带 有 两 个 占 位 符 的 SQL 语句 。 接 着 ， 在 构建 出 的 语句 上 ($sth)， 调 用 
execute() 方法 ， 按 顺序 传人 刚才 的 两 个 变量 ， 代 入 那 两 个 占 位 符 。 

结果 会 更 新 humans 表 中 Shuman_id 所 指 的 那 行 的 membership_expiration 列 。 因 为 humans 
表 的 UPDATE 权限 一 般 是 不 公开 给 外 界 的 ， 所 以 ， 你 最 好 还 是 限定 内 部 卫 带 密码 登录 ， 才 
能 使 用 该 程序 。 














16.3.4 ”Perl DBI 完 整 示例 

分 块 来 解释 一 个 程序 ， 听 起 来 会 容易 一 点 ， 但 可 能 不 利于 对 整体 布局 的 掌握 。 所 以 ， 我 
将 刚才 的 代码 片段 都 组 合 起 来 ， 创 建 一 个 程序 ， 取 名 member_adjust_expiration.plx。 如 
下 所 示 : 
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#!/usr/bin/perl -w use strict; 


use DBI; 

my $search_parameter = shift || ''; 

my Shuman id = shift || ''; 

my $membership_ expiration = shift || "'; 

my $user = 'admin members'; 

my S$password = 'doc_ killdeer 123'; 

my $host = 'localhost'; 

my $database = 'birdwatchers'; 

my $dbh = DBI->connect("DBI:mysql:$database:$host", $user, $password) 


|| die "Could not connect to database: " . DBI->errstr; 


if($search_parameter && !$membership expiration) { 


3 


my $sql_stmnt = "SELECT human_id， 
CONCAT(name_first, SPACE(1), name_last) AS fuLL_name， 
membership_expiration 
FROM humans 
WHERE name_last LIKE ?"; 


my $sth = $dbh->prepare($sql_stmnt); 
$sth->execute("%$search_parameter%"); 


my $members = $sth->fetchall_arrayref(); 
$sth->finish(); 

print "List of Members - '$search parameter' \n"; 
foreach my $member (@$members){ 


my ($human_id, $full_name, $membership_expiration) = @$member; 
print "$full_name ($human_id) - $membership expiration \n"; 


if($human_id && S$membership_ expiration) { 


$sth = $dbh->prepare($sql_stmnt); 
$sql_stmnt = "UPDATE humans 
SET membership_expiration = ? 
WHERE human id = ?2"; 


$sth = $dbh->prepare($sql_stmnt); 
my (Src) = $sth->execute($email address,$human_ id); 


$sth->finish(); 


if($Src) { 
print "Membership Expiration Changed. \n"; 
于 
else { 
print "Unable to change Membership Expiration. \n"; 





} 
} 


$dbh->disconnect(); 

exit(); 
在 命令 行 执行 该 程序 时 ， 如 果 在 程序 的 名 字 后 面 加 上 Hollar 作为 参数 ， 那 么 它 就 会 
Lexi Hollar 这 个 名 字 ， 后 跟 一 个 含有 她 的 human_id 的 括号 对 ， 0 
以 下 便 是 查询 Hollar 的 做 法 与 结果 : 


member_adjust_expiration.plx Hollar 























List of Members - 'Hollar' 
Lexi. Hollar (4) - 2013-09-22 


你 可 以 再 执行 一 遍 这 个 程序 ， 并 加 上 一 个 新 的 失效 日 期 如下: 


member_adjust_expiration.plx Hollar 4 2015-06-30 


注意 ， 要 更 新 失效 日 期 ， 你 需要 给 三 个 参数 。 如 果 程 序 只 收 到 一 个 参数 (会 员 的 姓氏 )， 
那么 它 会 执行 SELECT， 并 显示 用 户 信 息 ， 而 如 果 收 到 三 个 参数 ， 才 会 执行 UPDATE。 当 然 ， 
参数 的 顺序 和 格式 要 正确 ， 才 能 完成 UPDATE。 如 果 是 UPDATE， 程 序 也 会 告诉 你 更 新 失效 日 
期 是 否 成 功 。 

你 可 以 把 这 个 程序 写 得 更 精细 。 例 如 ， 人 允许 用 户 选 择 日 期 、 月 数 或 年 数 ， 用 MySQL 的 时 
间 日 期 函数 将 其 添加 到 失效 日 期 中 。 你 还 可 以 加 上 CGI Perl 模块 ， 使 用 户 能 通过 网 页 点 
击 来 调用 它 。 而 我 们 这 个 程序 是 很 初级 的 ， 只 是 让 你 了 解 如 何 着 手写 一 个 Perl API 来 与 
MySQL 交互 。 


16.3.5 ”更 多 信息 


如 果 想 学 习 Perl， 可 以 参考 由 Randal Schwartz、brian d foy 和 Tom Phoenix 合 著 的 《Perl 语 
言 入 门 》 (http://shop.oreilly.com/product/0636920018452.do)。 想 了 解 Perl DBI 的 更 多 相关 
知识 ， 可 以 参考 由 Alligator Descartes 和 Tim Bunce 合 著 的 《Perl DBI 编程 》(http://shop. 
oreilly.com/product/9781565926998.do)。 想 了 解 Perl 引用 和 其 他 更 高 级 的 话题 ， 可 以 参考 
Randal Schwartz 写 的 《Perl 进 阶 》 (http://shop.oreilly.com/product/0636920012689.do)。 


16.4 PHP API 


PHP 和 MySQL 是 Web 最 流行 的 编程 语言 与 数据 库 引 擎 的 组 合 之 一 。 其 中 的 原因 有 很 多 ， 
不 过 最 主要 的 是 它们 都 很 高 效 、 稳 定 和 简单 。 此 外 ，PHP 脚本 还 很 容易 与 HTML 搭配 来 
生成 网 页 。 所 以 ， 本 市 就 来 试 试 在 单个 网 页 中 用 PHP API 连接 和 查询 MySQL。 


16.4.1 安装 与 配置 


通过 PHP 来 连接 MySQL 的 API， 比 较 流 行 的 有 三 个 。 而 我 建议 你 用 mysqLit (MySQL 
Improved 的 缩写 ) 扩展 ， 它 是 mysql 扩展 的 新 版 。 本 市 的 例子 也 会 用 它 来 写 。 
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大 多 数 的 Linux 系统 都 预 装 了 PHP。 而 如 果 你 要 自己 安装 PHP 和 mysqlti 的 话 ， 可 以 使 用 
yun 之 类 的 安装 包 管理 工具 。 可 以 这 样 来 做 : 

yum install php php-mysql 
PHP 能 和 藤 在 网 页 中 ， 这 是 它 的 一 个 很 不 错 的 特性 。 如 果 你 要 这 样 写 ， 就 可 能 会 需要 调 一 下 
网 页 服务 器 的 配置 。 对 于 Apache 来 说 ， 要 在 Apache 配置 文件 中 加 一 个 AddType， 告 诉 网 
页 服务 器 用 PHP 来 执行 网 页 文件 中 的 代码 。 可 以 把 下 面 这 行 放 在 httpd.conf 中 ， 以 造成 全 
局 的 影响 ， 也 可 以 把 它 放 在 含有 PHP 代码 的 HIML 网 页 所 在 的 目录 的 .htaccess 文件 中 。 


AddType application/x-httpd-php .html 
修改 httpd.conf 的 指令 ， 需 要 重启 Apache 才能 生效 。 而 写 在 .htaccess 中 则 不 用 这 么 做 。 
要 将 PHP 与 MySQL 搭配 使 用 ， 你 可 能 还 需要 用 --with-mysql=/path_to_mysql 选项 来 配置 
PHP。 而 在 使 用 yun 安装 PHP API 的 情况 中 ， 这 是 不 用 的 。 
16.4.2 ”连接 MySQL 


要 用 PHP 来 与 MySQL 交互 ， 得 先 连接 MySQL， 以 建立 一 个 MySQL 客户 端 会 话 。 需 要 
用 到 的 代码 不 多 ， 如 下 所 示 : 


<?php 

















$host = 'localhost'; 
$user = 'public api'; 
$pw = 'pwd_123'; 
$db = 'rookery'; 


$connect = new mysqli($host, $user, $pw, $db); 


if (mysqli_connect errno()) { 
printf("Connect failed: %s\n", mysqli_connect_error()); 
exit(); 


} 


?> 


这 些 代码 是 用 <?php.……?> 包 起 来 的 ， 这 样 便 可 以 嵌 到 HTML 中 。 而 如 果 你 想 写 一 个 从 命 
令 行 执行 的 程序 ， 则 要 以 本 /usr/bin/php 开头 。 不 过 ， 此 例 是 在 网 页 中 写 代码 。 


这 些 代码 首先 创建 了 一 些 连接 MySQL 和 选取 默认 数据 库 所 需 的 变量 ， 在 这 些 变量 之 后 ， 
我 们 用 mysqti() 国 数 来 建立 连接 ， 并 用 $connect 变量 指向 建 好 的 连接 。 如 果 连 接 没 建成 
功 ， 就 打印 错误 信息 ， 并 停止 脚本 。 如 果 成 功 ， 下 一 步 就 可 以 发 起 查询 。 其 间 连 接 会 一 直 
开 着 ， 直 到 最 后 我 们 才 会 关闭 它 。 















































16.4.3 查询 MySQL 


下 面 要 做 的 便 是 在 脚本 中 查询 birds 表 ， 获 取 一 些 岛 的 信息 。 你 可 以 把 以 下 代码 接 到 之 前 
建立 连接 的 代码 后 面 ， 不 过 要 在 同一 个 网 页 内 。 这 样 就 能 发 起 查询 ， 取 出 birds 表 的 行 ， 
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并 把 它们 展示 给 用 户 : 


<?php 
$sql_stmnt = "SELECT common_nNname, scientific_ name 
FROM birds 
WHERE LOWER(common_name) LIKE LOWER(?)"; 
$sth = $connect->prepare($sql_stmnt); 


$search_parameter 
$search_parameter 


$_REQUEST[ 'birdname' ] ; 
"%" . $search parameter . "%"; 


$sth->bind_param('s', $search_parameter); 


$sth->execute(); 
$sth->bind_result($common_ name, $scientific name); 


while( $sth->fetch() ) { 
print "Scommon_name - <i>$scientific_ name</i><br/>"; 


让 


Ssth->cLose(); 
$connect->close(); 
要 如 


首先 创建 变量 $sqL_stmnt， 在 其 中 保存 一 条 想 要 执行 的 SQL 语句 。 然 后 ， 用 $connect 的 
prepare() 函数 解析 它 ， 并 以 $sth 指向 解析 出 的 执行 计划 。 

这 个 脚本 的 使 用 方法 是 : 用 户 在 网 址 未 尾 带 上 自己 的 查询 条 件 ， 然 后 发 送 请 求 。 例 如 ， 在 
网 址 中 加 上 ?birdname=Avocet 来 发 起 查询 ， 用 户 就 可 以 收 到 一 堆 Avocet 鸟 的 信息 了 。 























Web 表单 


Web 用 户 一 般 不 会 在 网 址 结尾 处 输入 变量 名 和 搜索 值 。 我 们 需要 在 这 个 正在 建立 的 网 
页 前 面 ， 提 供 另 一 个 含有 HTML 表单 的 网 页 给 用 户 ， 让 他 们 在 里 面 填 查 询 参 数 。 这 个 
Web 表单 大 致 如 下 : 


<h3>Search Birds Database</h3> 

<form action="birds.html" method="post"> 
<p>Enter a parameter by which to search 

the common names of birds in our database:</p> 
<input type="text" name="birdname" /> 

<input type="submit" /> 

</form> 


由 这 个 表单 来 调用 PHP 网 页 ， 以 正确 的 格式 传递 查询 参数 。 











接 下 来 的 两 行将 查询 参数 取出 ， 放 到 变量 $search_parameter 中 。 而 因为 我 们 的 SQL 语句 
用 了 LIKE， 所 以 还 得 给 变量 的 前 后 拼接 上 %。 
之 后 ， 用 btnd_param() 方法 将 参数 与 $search_parameter 绑 定 。 因 为 该 列 是 字符 串 类 型 ， 


所 以 还 要 给 bind_param() 的 第 一 个 参数 传 's' 。 绑 定之 后 ， 便 可 调用 execute() 来 执行 查 
询 了 。 
























































接着 ， 用 bind_result() 来 指定 查询 结果 要 赋 到 什么 变量 中 。 再 用 while 循环 调用 $sth 的 
fetch() 方法 ， 并 把 每 次 取 到 的 值 与 HTML 标签 拼 起 来 ， 再 打印 出 来 。 最 后 ， 关 闭 执行 计 
划 和 数据 库 连 接 。 

脚本 的 运行 结果 就 是 根据 查询 条 件 ， 将 查 得 的 每 种 鸟 一 行 行 地 展示 出 来 。 整 个 例子 其 实 很 
简单 ， 只 用 了 几 个 PHP 函数 来 获取 并 展示 数据 。 以 下 是 戏 入 HTML 后 的 完整 代码 : 


<htmL> 
<body> 












































<?php 
$search_parameter = $_REQUEST['birdname']; 


$host = 'localhost'; 
$user = 'public api'; 
$pw = 'pwd_123'; 
$db = 'rookery'; 


$connect = new mysqli($host, $user, $pw, $db); 


if (mysqli connect errno()) { 
printf("Connect failed: %s\n", mysqli_connect_error()); 
exit(); 

} 


?> 


<h3>Birds - <?php echo $search_parameter ?></h3> 
<p>Below is a list of birds in our database based on your search criteria:</p> 


<?php 
$sql_stmnt = "SELECT common_name, scientific_name 
FROM birds 
WHERE Common_name LIKE ?"; 
$sth = $connect->prepare($sql_stmnt); 


$search_parameter = "%" . $search parameter . "%"; 
$sth->bind_param('s', $search_ parameter); 
$sth->execute(); 

$sth->bind_result($common name, $scientific name); 


while($sth->fetch()) { 
print "$common_name - <i>$scientific name</i><br/>"; 


} 


$sth->close(); 
$connect->close(); 
?> 


</body> 
</html> 


这 个 例子 看 起 来 与 前 两 市 的 差不多 。 我 们 在 代码 的 前 后 加 了 body 和 html 标签 ， 并 在 两 段 


PHP 代码 之 间 加 了 一 些 文本 。 我 们 还 给 某 些 语句 的 位 置 做 了 调整 ， 不 过 这 并 设 有 影响 整体 
流程 。 如 果 Web 用 户 查 的 是 Avocet 岛 ， 那 么 就 会 得 到 以 下 文本 。 


























Birds - "Avocet" 
Below is a list of birds in our database based on your search criteria: 


Pied Avocet - Recurvirostra avosetta 

Red-necked Avocet - Recurvirostra novaehollandiae 
Andean Avocet - Recurvirostra andina 

American Avocet - Recurvirostra americana 
Mountain Avocetbill - Opisthoprora euryptera 


16.4.4 更 多 信息 


想 学 习 更 多 关于 mysqlti 的 知识 ， 可 以 看 看 PHP 的 网 站 ， 那 里 有 详尽 的 手册 ， 还 有 一 本 
MySQOL Improved Extension 手册 (http://php.net/manual/en/book.mysqli.php)。 此 外 ， 你 可 
以 读 读 Robin Nixon 写 的 《PHP、MySQL 与 JavaScript 学 习 手 册 》 (http://shop.oreilly.com/ 
product/0636920036463.do)， 这 本 书 也 能 帮助 你 深入 了 解 如 何在 网 页 中 使 用 PHP 来 操作 
MySQL。 


16.5 Python 


要 想 在 Python 中 操作 MySQL， 可 以 用 MySQL Connector/Python。 它 是 用 Python 写 的 ， 只 
用 到 Python 的 标准 库 ， 不 需要 其 他 Python 模块 ， 连 MySQL 客户 端 库 也 不 需要 。 











16.5.1 安装 


首先 需要 在 服务 器 上 安装 MySQL Connector/Python。 若 在 Linux 系统 上 安装 ， 可 以 用 yum 
之 类 的 安装 工具 。 虽 然 你 的 服务 器 可 能 自 带 了 Python 和 Python 库 ， 但 你 也 可 以 试 试 能 否 
安装 ， 以 防 万 一 。 从 命令 行 执行 以 下 命令 。 


yum install python python-libs mysql-connector-python 








本 节 使 用 的 是 Python 2， 它 是 目前 Linux 和 Mac 上 的 主流 版 本 。 而 Python 3 
也 正在 流行 起 来 ， 它 与 Python 2 在 语法 上 有 点 不 同 ， 具体 可 以 参考 相关 文 
档 。 如 果 想 用 Python 3， 或 者 另 一 个 用 来 连接 Python 和 MySQL 的 库 ， 只 需 
稍微 修改 本 节 的 示例 即 可 。 

















安装 好 连接 器 后 ， 就 可 以 开始 编写 并 运行 一 个 Python 程序 ， 来 连接 MySQL 和 查询 数据 
库 。 本 节 的 示例 假设 有 个 需求 : 数据 库 管 理 员 希望 我 们 能 提供 一 个 程序 ， 以 便 查 询 数据 库 
账号 及 各 账号 的 权限 。 下 面 我 们 就 来 实现 它 。 

16.5.2 ”连接 MySQL 

要 用 Python 查询 数据 库 ， 首 先 得 建立 连接 。 下 面 是 Python 程序 的 开头 部 分 : 


#!/usr/bin/python 


























import mysql.connector 




















config = { 


"user': "admin_ granter ' ， 
"password' : 'avocet 123', 
"host ' : "LocaLhost ' ， 
"database' : 'rookery' 
} 
cnx = mysql.connector.connect(**config) 
cur = cnx.Cursor(buffered=True) 


第 一 行 指定 命令 行 用 Python 来 执行 此 脚本 。 接 着 ， 引 入 MySQL Connector/Python， 即 
mysql.connector。 然 后 ， 创 建 一 个 散 列 常量 来 存储 账号 、 窗 码 等 登录 人 信息。 这里， 我 们 
用 的 用 户 账号 是 admin_granter@localhost (在 13.3.4 节 建 的 )， 因 为 它 有 权限 执行 SHOW 
GRANTS， 并 查询 存 有 账号 信息 的 mysql 数据 库 ， 这 正好 符合 我 们 的 要 求 。 

最 后 两 行 用 于 建立 连接 。 其 中 ， 第 一 行 调用 MySQL Connector/Python 的 connect() 方法 ， 
并 把 刚才 的 config 散 列 常量 传 进 去 ， 再 以 cnx 变量 保存 所 建 的 连接 。 第 二 行 则 是 创建 一 个 
游标 对 象 cur， 以 备 后 面 执行 查询 时 使 用 。 























16.5.3 ”查询 MySQL 


因为 没有 SHOW USERS 语句 ， 所 以 我 们 必须 素 自 查询 mysql 数据 库 的 user 表 ， 来 获取 用 户 
账号 信息 。 为 此 ， 先 建 一 个 变量 来 保存 需要 执行 的 SELECT 语句 ， 然 后 用 execute() 执行 
它 ， 如 下 所 示 : 

sql_stmnt = ("SELECT DISTINCT User, Host FROM mysqL.db " 


"WHERE Db IN('rookery','birdwatchers') " 
"ORDER BY User, Host") 





cur .execute(sql_stmnt) 


为 了 适应 书页 的 宽度 ， 我 们 将 SELECT 语句 拆 成 几 行 了 。 我 们 把 变量 传 给 execute() 来 执行 
该 SQL 语句 。 现 在 便 可 以 取出 每 一 行 ， 解 析 每 个 域 , 再 显示 出 来 : 


for row in cur.fetchall() : 
user_name = row[0] 
host_address = row[1] 
User_account = "'" + User _ name + "'@'" + host address + 





wn 


print "%s@%s" % (user_name, host_address) 


cur.close() 
cnx.close() 


对 于 cur 的 fetchall() 方 法 所 返回 的 结果 集 ， 我 们 用 for 来 侦 历 它 。 这 将 在 每 次 人 循环 中 ， 
把 每 行 的 各 个 域 都 存在 数组 row 中 。 而 在 for 块 中 ， 我 们 再 将 各 域 取 出 ， 暂 存 到 字符 串 变 
量 user_name 和 host_address 中 。 接 着 ， 用 一 些 额外 的 文本 跟 它 们 拼接 ， 以 构造 得 好 看 一 
点 ， 再 把 它们 存 到 变量 user_account 中 ， 它 的 内 容 类 似 Lena_stankoska@localhost。 


逐 行 打印 完 user_account， 把 结果 展示 给 管理 员 ， 程 序 就 结束 了 。 和 然后， 关闭 游标 对 象 和 











MySQL 连接 。 


16.5.4 Python 程序 示例 
像 刚才 那样 把 程序 拆 分 ， 会 比较 容易 说 明 ， 但 可 能 让 人 不 明白 整个 流程 是 怎样 的 。 所 以 ， 


下 























看 我 将 那些 代码 片段 进行 合并 ， 不 过 在 里 面 加 入 了 一 些 新 内 容 ， 使 程序 更 精细 : 














#!/usr/bin/python 


import re 
import mysql.connector 


# connect to mysql 


config = { 
"user': 'admin_granter', 
'password': 'avocet 123', 
'host': 'localhost', 
'database': 'rookery' 
} 
Cnx = mysql.connector .connect(**config) 


cur = cnx.cursor(buffered=True) 


# query mysql database for list of user accounts 
sql_stmnt = "SELECT DISTINCT User, Host FROM mysql.db " 
sql_stmnt += "WHERE Db IN('rookery','birdwatchers') " 
sql_stmnt += "ORDER BY User, Host" 


cur.execute(sql_stmnt) 


# loop through list of user accounts 
for user_accounts in cur.fetchaLL() : 

User_name = User_accounts[0] 

host_address = User_accounts[1] 

User_account = "'" + User_name + "'@'" + host address + "'" 
# display user account heading 
print "\nUser Account: %s@%s" % (user_name, host_address) 
print -1 


# query mysql for grants for User account 
sql_stmnt = "SHOW GRANTS FOR ”+ User_account 
cur .execute(sql_stmnt) 


# loop through grant entries for user account 
for grants in cur.fetchaLL() : 
# skip 'usage' entry 
if re.search('USAGE', grants[0]) : 
continue 


# extract name of database and table 

dbtb = re.search('ON\s(.*)\.+?(.+?)\sT0', grants[0]) 
db = dbtb.group(1) 

tb = dbtb.group(2) 
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# change wildcard for tables to 'all' 
if re.search('\*', tb) : 
tb = "all" 


# display database and table name for privileges 
print "database: %s; table: %s" % (db,tb) 


# extract and display privileges for user account 
# for database and table 

privs = re.search('GRANT\s(.+?)\sON', grants[0]) 
print "privileges: %s \n" % (privs.group(1)) 


cur.close() 
cnx.close() 


很 明显 以 上 代码 比 之 前 的 片段 多 了 很 多 内 容 。 为 了 便于 理解 ， 我 加 上 了 注释 。 接 下 来 ,我 
们 就 再 分 析 一 遍 这 个 代码 (特别 是 新 加 的 部 分 )。 

一 开始 ， 它 先 查 出 一 些 账号 ， 把 它们 保存 到 user_accounts 数组 中 。 然 后 ， 通 过 for 循环 ， 
遍历 user_accounts 的 每 一 行 ， 抽 取 每 一 个 user_account， 并 打印 出 每 个 用 户 名 和 主机 作 
为 标题 。 至 此 ， 它 跟 之 前 的 代码 都 还 是 挺 像 的 。 

接着 ， 对 于 每 个 账号 ， 我 们 都 在 sqL_stmnt 中 新 加 入 SHOW GRANTS， 并 再 用 一 个 for 循环 
来 遍历 fetchall() 的 结果 集 (保存 在 grants 变量 中 )。 在 遍历 的 过 程 中 ， 若 碰 到 某 行 含有 
USAGE， 则 跳 过 该 行 。 而 对 于 那些 没 跳 过 的 ， 则 要 解析 出 数据 库 名 和 表 名 ， 存 到 变量 db 和 
tb 中 ， 然 后 打印 出 来 。 最 后 两 行 抽取 权限 并 打印 出 来 。 

以 下 是 在 我 的 系统 上 运行 这 个 Python 程序 所 得 的 部 分 结果 : 


User Account: lena_stankoska@localhost 



























































database: “rookery `; table: all 
privileges: SELECT, INSERT, UPDATE, DELETE 


database: ‘birdwatchers’; table: all 
privileges: SELECT, INSERT, UPDATE 


User Account: public api@localhost 


database: ‘birdwatchers’; table: all 
privileges: SELECT 


database: ‘rookery’; table: all 
privileges: SELECT 


因为 MySQL 本 身 并 没有 内 置 函 数 可 以 做 到 这 些 ， 所 以 此 程序 非常 便于 管理 上 5 
号 在 哪些 数据 库 和 表 上 有 些 什么 权限 。 
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16.5.5 更 多 信息 


如 果 想 了 解 更 多 有 关 MySQL Connector/Python 的 内 容 ， 可 以 到 MySQL 网 站 查看 详尽 
的 手册 ， 其 中 包括 MySQL Connector/Python Developer Guide (http://dev.mysql.com/doc/ 
connector-python/en/) 。 还 可 以 读 读 Mark Lutz 写 的 《Python 语言 和 人 门 》(http:/shop.oreilly. 
com/product/0636920028154.do ) 


16.6 Ruby API 


Ruby 现在 已 经 是 一 门 非 常 流行 的 语言 了 。 同 样 ， 它 也 可 以 用 来 创建 操作 数据 库 的 程序 。 
如 果 要 操作 MySQL， 我 们 有 两 个 选择 。 其 中 ， 以 MySQL 的 C API 构建 的 MySQL/Ruby 
模块 因为 拥有 与 C API 一 样 的 方法 ， 所 以 特别 适合 那些 熟悉 C API 的 人 。 而 另 一 个 Ruby/ 
MySQL 模块 (注意 ， 它 的 名 字 跟 刚才 那个 相 比 是 倒转 的 )， 是 用 Ruby 写 的 ，Ruby on Rails 
也 采用 它 。 不 过 本 市 的 例子 只 用 MySQL/Ruby 模块 。 


16.6.1 安装 和 准备 使 用 MySQL/Ruby 
在 写 与 MySQL 交互 的 Ruby 程序 之 前 ， 我 们 先 来 安装 MySQL/Ruby 模块 。 它 和 MySQL C 
API 使 用 的 函数 相同 。 在 Linux 上 ， 可 以 用 yun 之 类 的 安装 包 管理 工具 来 做 。 先 以 root 或 
其 他 管理 员 账 号 登录 系统 ， 然 后 在 命令 行 中 执行 以 下 命令 : 

yum install ruby ruby-mysql 
如 果 你 用 不 了 yum， 可 以 试 试 到 MySQL 的 网 站 去 下 载 Ruby 模块 (http://dev.mysql.com/ 
downloads/mruby.html) ， 并 按照 指南 进行 安装 。 
安装 好 Ruby 和 MySQL/Ruby 模块 后 ， 就 可 以 开始 编写 并 执行 Ruby 程序 ， 来 连接 MySQL 
和 查询 数据 库 。 本 节 的 程序 示例 很 简单 。 我 们 要 用 13.2.1 节 所 建 的 admin_backup@ 
localhost， 到 server_admin 数据 库 去 查询 和 插入 数据 。 其 中 ，backup_policies 表 用 来 记录 
一 些 备份 策略 的 相关 信息 。 该 数据 库 用 于 保存 一 些 备 份 计划 和 实施 情况 。 
先 来 创建 server_admin 数据 库 和 backup_policies 表 : 


CREATE DATABASE server_admin; 































































































CREATE TABLE backup_policies 

(poLicy_ id INT AUTO_INCREMENT KEY ， 
backup_name VARCHAR(100 ) ， 

file_format_prefix VARCHAR(25), 

frequency ENUM('daily','weekly'), 

days ENUM('first','every'), start_ time TIME, 
secure TINYINT DEFAULT 0， 

Location ENUM('on-site','off-site','both'), 
tables_include VARCHAR(255) ); 


建 好 后 ， 把 表 14-2 中 与 备份 策略 相关 的 数据 插入 backup_policies 表 。 执 行 以 下 INSERT 
语句 : 
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INSERT INTO backup_policies 

(backup_name, file format_prefix, frequency, 

days, start_ time, secure, location, tables_include) 

VALUES 

('rookery - full back-up', 'rookery-', 2, 1, '08:00:00', 0, 2, "all tables"), 

('rookery - bird classification', 'rookery-class-', 1, 2, '09:00:00', 0, 1, 
"birds, bird_ families, bird_orders"), 

('birdwatchers - full back-up', 
'birdwatchers-', 2, 1, '08:30:00', 1, 2, "all tables"), 

('birdwatchers - people', 'birdwatchers-people-', 1, 2, '09:30:00', 1, 1, 
"humans, birder families, birding events_children"), 

('birdwatchers - activities', 'birdwatchers-activities-', 1, 2, '10:00:00', 0, 1, 
"bird_sightings, birding events, bird identification tests, 
prize_ winners, surveys, survey_answers, survey_questions"); 


此 外 ， 我 们 还 需要 在 server_admin 数据 库 中 创建 另 一 个 表 。 我 们 把 这 个 表 叫 作 backup_ 
reports， 以 保存 备份 程序 所 生成 的 报告 。 创 建 这 个 表 的 SQL 语句 如 下 : 


CREATE TABLE backup_reports 
(report_ id INT AUTO_INCREMENT KEY ， 
report_date DATETIME, 
admin_name VARCHAR(100 ) ， 
report TEXT) ; 
该 表 很 简单 ， 仅 含有 报告 DD、 报告 日 期 、 生 成 报告 的 管理 员 名 字 ， 以 及 报告 内 容 ( 即 由 我 
们 接 下 来 要 写 的 备份 程序 所 输出 的 内 容 )。 因 为 我 们 将 用 admin_backup 这 个 账号 ， 所 以 还 
要 给 它 授予 操作 server_admin 数据 库 的 权限 。 为 此 ， 需 要 执行 以 下 SQL 语句 : 
GRANT SELECT, INSERT ON server_admin.* 
TO ‘admin_backup'@' localhost'; 


这 样 ， 我 们 就 可 以 开始 写 备 份 程序 了 。 


16.6.2 ”连接 MySQL 
用 Ruby 查询 数据 库 之 前 ， 必 须 先 建立 连接 。 所 以 ， 我 们 会 这 样 


require 'mysql' 
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user = 'admin_backup' 
password = "its_password_123 
host = "LocaLhost ' 

database = 'server_admin' 


begin 
con = Mysql.new host, user, password, database 


# Database Queries Here 
# ... 


rescue Mysql::Error => e 
puts e.errno 
puts e.error 





ensure 
con.close if con 








end 
此 片段 展示 了 如 何 使 用 Ruby 来 连接 MySQL 并 随后 断 开 连接 。 首 先 ， 第 一 行 是 调用 Ruby 
来 解释 此 脚本 的 常规 写法 。 接 着 ， 下 一 行 引 入 mysql 模块 。 然 后 ， 再 定义 一 些 与 连接 相关 




















的 变量 〈 你 不 一 定 要 起 上 面 那样 的 名 字 )。 

接着 ， 把 所 有 与 数据 库 交 互 的 动作 都 放 到 begin 块 中 。 在 该 块 中 ， 先 用 刚才 定义 的 变量 建 
立 一 个 数据 库 连接 (这 些 变量 或 参数 的 顺序 必须 如 上 所 示 )。 

建立 好 连接 后 ， 就 可 以 执行 SQL 语句 了 。 不 过 ， 我 在 这 里 暂时 把 查询 数据 库 的 内 容 省 略 掉 
了 ， 之 后 再 详细 写 出 。 

如 有 果 建 立 不 了 连接 ， 就 用 后 面 的 rescue 块 来 接管 报错 ， 在 里 面 用 puts 把 错误 信息 打印 出 
来 。 而 最 后 的 ensure 块 及 其 内 容 ， 则 用 来 确保 程序 在 结束 时 ， 关 掉 打 开 的 连接 。 



























































16.6.3 查询 MySQL 


在 试 过 运行 一 个 简单 的 Ruby 程序 并 与 MySQL 连接 和 断 开 连接 之 后 ， 我 们 继续 看 看 如 何 
在 连接 开启 的 情况 下 ， 用 Ruby API 来 查询 数据 库 。 


先 简单 地 尝试 从 birds 表 中 查询 一 些 Avocet 鸟 。 为 此 ， 我 们 先 要 定义 一 个 变量 ， 用 于 保 
存 我 们 想 要 执行 的 SELECT 语句 。 然 后 ， 将 它 交 给 query() 方法 去 执行 。 这 部 分 的 程序 如 
下 所 示 : 

sql = "SELECT common_name, scientific_ name 


FROM birds 
WHERE Common_name LIKE '%Avocet%'" 











rows = con.query(sqL) 


rows.each do |row| 

common_name = row[0] 

scientific name = row[1] 

puts common name + ' - ' + scientific name 
end 


query() 执行 之 后 ， 我 们 在 其 返回 结果 上 调用 了 each， 来 人 帝 历 查 得 的 所 有 行 。 在 遍历 过 程 
中 ， 每 经 过 一 行 ， 就 将 该 行 赋 给 row 数组 。 然 后 ， 因 为 每 行 数据 都 已 包装 成 数组 的 形式 ， 
所 以 ， 我们 就 以 获取 数组 元 素 的 方式 ， 将 其 位 置 0 和 1 的 对 象 ， 分 别 赋 给 common_name 和 
scientific_nane。 最 后 ， 将 这 两 个 变量 的 内 容 以 横 杠 拼接 ， 打 印 出 来 。 


16.6.4 MySQL/Ruby 程 序 示例 


拆 分 代码 会 比较 容易 说 明 ， 但 可 能 让 人 搞 不 清楚 整个 流程 。 所 以 ， 下 面 我 提供 一 个 用 到 
MySQL/Ruby 模块 的 完整 Ruby 程序 。 这 个 程序 的 用 途 与 刚才 的 不 同 ， 它 是 用 来 根据 制定 
好 的 备份 策略 检查 备份 文件 的 目录 (这 个 任务 在 14.3 市 中 介绍 过 )。 它 可 以 向 管理 员 展 示 
过 去 几 天 所 产生 的 备份 文件 ， 并 将 这 些 结果 的 报告 保存 到 server_admin 数据 库 的 backup_ 




























































































应 用 编程 接口 | 277 











reports 表 中 : 


#!/usr/bin/ruby 
require 'mysql' 


# create date variables 
time = Time.new 

yr = time.strftime("%Y") 
mn = time.strftime("%m") 
mon = time.strftime("%b") 
dy = time.strftime("%d") 


# variables for connecting to mysql 
User = 'admin_backup' 

password = 'its_password_123" 

host = 'localhost' 

database = 'server_admin' 


# create other initial variables 
bu_dir = "/data/backup/rookery/" 


admin_name = "Lena Stankoska" 
bu_report = "Back-Up File Report\n" 
bu_report += -7 \n" 


puts bu_report 


Tt 0 
num = 7 


begin 
# connect to mysql and query database for back-up policies 
con = Mysql.new host, user, password, database 
sql = "SELECT policy_id, backup_name, frequency, 
tables_include, file format_prefix 
FROM backup_policies" 
policies = con.query(sql) 


policies.each_hash do |policy| # loop through each row, each policy 
# capture fields in variables 
bu_name = policy['backup_name'] 
bu_pre = policy['file format_prefix'] 
bu_freq = policy['frequency'] 


# assemble header for policy 


bu_header = "\n" + bu name + " (performed " + bu_ freq + ")\n" 
bu_header += "(" + bu_pre + "yyyy-mmm-dd.sql) \n" 
bu_header += "7-1 \n" 


bu_report += bu_header 
puts bu_header 


until it > num do # iterate through 7 back-up files (i.e., days) 
bk_day = dy.to i - it 


# assemble backup filename 





bu_file_ suffix = yr + + mon.downcase + + bk_day.to s + ".sql" 
bu_file = bu_pre + bu file suffix 


bu_path_ file = bu_ dir + bu file 


# get info. on back-up file if it exists 
if File::exists?(byu_path file) 
bu_size = File.size?(buyu_path_ file) 
bu_size _ human = bu_size / 1024 
bu_file entry = bu file + " (" + byu_size human.to_s + "k)" 
bu_report += bu_file entry + "\n" 
puts bu_file entry 
end 
it +=1 
end 
it = 0 
end 
end 


begin 
# insert report text acCumuLated in backup_reports table 
con = Mysql.new host, user, password, database 
sql = "INSERT INTO backup_reports 
(report_date, admin_name, report) 
VALUES (NOW(), ?, ?)" 
prep_sql = con.prepare sql 
prep_sql.execute(admin_ name,bu_report) 


rescue Mysql::Error => e 
puts e.errno 
puts e.error 


ensure 
con.close if con 
end 


虽然 代码 的 每 一 部 分 都 加 了 注释 ， 但 我 还 是 想 再 大 概 说 一 下 (不 过 其 中 某 些 地 方 会 着 重 
= 


首先 ， 获 取 当 前 日 期 ， 并 设置 一 些 变 量 ， 用 于 查找 备份 文件 。 之 所 以 按 日 期 来 检查 ， 是 因 
为 在 我 们 的 备份 策略 中 ， 备 份 文件 的 命名 规范 就 是 这 样 的 。 

然后 ， 跳 到 bu_report 那里 ， 这 个 变量 是 用 来 存储 报表 的 。 报 表 的 内 容 会 随 着 程序 的 运行 ， 
不 断 地 追加 新 的 条 目 (这 些 条 目 也 会 在 产生 后 即刻 被 打印 到 屏幕 上 )。 最 后 ， 这 个 报表 变 
量 会 代入 SQL 语句 ， 被 插 到 backup_reports 里 。 


回 过 来 看 看 第 一 个 begin 块 。 这里， 我 们 先 执行 了 一 个 SELECT， 来 查询 backup_policies 
表 的 备份 策略 。 该 表 保 存 着 各 备份 文件 的 命名 规范 ( 表 名 和 日 期 后 级 )。 我 们 把 这 些 备份 
策略 保存 在 policies 这 个 散 列 常量 中 。 使 用 each 遍历 每 一 个 potlicy， 然 后 每 个 都 用 until 
循环 七 次 ， 拼 接 出 最 近 七 天 的 备份 文件 名 。 检 查 备 份 文件 存放 目录 中 是 否 真 的 存在 这 些 文 
件 名 ， 如 果 存 在 ， 则 将 名 字 及 文件 大 小 记录 到 报表 变量 bu_report 中 。 


第 二 个 pegin 块 执行 一 个 INSERT， 把 bu_report 连同 日 期 和 管理 员 的 名 字 录 入 backup_ 
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reports 表 。 以 下 便 是 该 表 的 其 中 一 条 记录 。 
类 淡淡 火 火 火炎 火炎 类 火炎 淡淡 火 尖 类 火炎 火 火 大火 火炎 类 类 62. row 类 火炎 火炎 炎炎 火炎 火炎 淡淡 炎炎 火炎 类 火炎 炎炎 火炎 火炎 类 
report_id: 62 
report_date: 2014-10-20 14:32:37 


admin_name: Lena Stankoska 
report: Back-Up File Report 


rookery - full back-up (performed weekly) 
(rookery-yyyy-mmm-dd.sqL) 
rookery-2014-oct-20.sqL (7476k) 
rookery-2014-oct-13.sqL (7474k) 


rookery - bird classification (performed daily) 
(rookery-class-yyyy-mmm-dd.sql) 
rookery-class-2014-oct-20.sql (2156k) 
rookery-class-2014-oct-19.sql (2156k) 
rookery-class-2014-oct-18.sql (2156k) 
rookery-class-2014-oct-17.sql (2154k) 
rookery-class-2014-oct-16.sql (2154k) 
rookery-class-2014-oct-15.sql (2154k) 
rookery-class-2014-oct-14.sql (2154k) 
rookery-class-2014-oct-13.sql (2154k) 
birdwatchers - full back-up (performed weekly) 
(birdwatchers-yyyy-mmm-dd.sql) 
birdwatchers-2014-oct-20.sqL (28k) 
birdwatchers-2014-oct-13.sql (24k) 


birdwatchers - people (performed daily) 
(birdwatchers-people-yyyy-mmm-dd.sql) 

birdwatchers-people-2014-oct-20.sql (6k) 
birdwatchers-people-2014-oct-19.sql (6k) 
birdwatchers-people-2014-oct-18.sql (6k) 
birdwatchers-people-2014-oct-17.sql (4k) 
birdwatchers-people-2014-oct-16.sql (4k) 
birdwatchers-people-2014-oct-15.sql (4k) 
birdwatchers-people-2014-oct-14.sql (4k) 
birdwatchers-people-2014-oct-13.sql (4k) 


birdwatchers - activities (performed daily) 
(birdwatchers-activities-yyyy-mmm-dd.sql) 
birdwatchers-activities-2014-oct-20.sql (15k) 
birdwatchers-activities-2014-oct-19.sql (15k) 
birdwatchers-activities-2014-oct-18.sql (15k) 
birdwatchers-activities-2014-oct-17.sql (15k) 
birdwatchers-activities-2014-oct-16.sql (15k) 
birdwatchers-activities-2014-oct-15.sql (13k) 
birdwatchers-activities-2014-oct-14.sql (13k) 
birdwatchers-activities-2014-oct-13.sql (13k) 





16.6.5 更 多 信息 


如 果 想 学 习 更 多 关于 Ruby 与 MySQL 交互 的 相关 知识 ， 可 以 看 看 Tomita Masahiro 写 
的 使 用 手册 (http:Wwww.tmtm.org/en/mysqlruby/)。Tomita Masahiro 是 MySQL Ruby 
模块 的 创造 者 。 此 外 ，Michael Fitzgerald 写 的 《学 习 Ruby》(http:/shop.oreilly.comy 
product/9780596529864.do) 应 该 也 会 对 你 有 所 帮助 。 


16.7 SQL 注 入 


公开 给 他 人 使 用 的 数据 库 API， 无 论 是 Web 还 是 其 他 形式 ， 都 有 可 能 会 被 用 来 攻击 数 
据 库 。 通 过 API 往返 于 用 户 界面 和 服务 器 之 间 的 数据 是 可 以 被 自 改 的 ， 尤 其 是 黑客 可 以 把 
SQL 语句 姐 入 数据 ， 从 而 让 API 拼接 出 恶意 查询 语句 ， 进 而 破坏 数据 ， 窃 取 敏 感 或 重要 信 
息 ， 或 创建 全 能 账号 做 进一步 攻击 。 这 就 是 人 们 所 说 的 SQL 注入 。 
这 个 问题 其 实 与 引号 有 点 关系 : 要 把 SQL 语句 注入 字符 捉 参 数 ， 黑 客 只 需要 闭合 引号 ， 接 
上 分 号 ， 再 往 后 添加 男 一 条 自己 写 的 SQL 语句 。 而 如 果 是 想 注 入 数字 参数 ， 那 直接 加 一 个 
不 带 引 号 的 子 句 就 可 以 另 起 SQL 语句 。 
下 面 我 们 以 PHP API 为 例 ， 演 示 一 下 如 何 对 没有 占 位 符 的 SQL 语句 进行 和 注入。 假设 我 们 
的 SQL 语句 中 租 入 了 一 个 名 为 $search_parameter 的 变量 : 

$sql_stmnt = "SELECT common_name, scientific name 


FROM birds 
WHERE Common_name LIKE '%$search parameter%'" 


假设 黑客 在 使 用 API 项 目 时 ， 不 传 鸟 的 俗名 ， 而 是 传 以 下 这 串 内 容 《两头 都 带 单 引 号 ) : 
'; GRANT ALL PRIVILEGES ON *.* TO "bad_guy'@'%'; ， 
那么 就 会 拼接 出 如 下 SQL 语句 : 


SELECT common_name, scientific name FROM birds 
WHERE Common_name LIKE '%'; 















































GRANT ALL PRIVILEGES ON *.* TO 'bad_guy'@'%'; 
o's 


它 实际 上 是 三 条 SQL 语句 ， 而 不 只 是 一 条 。 其 中 ， 第 一 条 语句 会 查 出 儿 乎 所 有 的 鸟 。 而 
第 三 条 ， 因 为 不 是 完整 的 SQL 语句 ， 所 以 会 报错 。 但 这 都 不 算 大 问题 ， 第 二 条 语句 才 最 
关键 。 系 统 会 创建 一 个 用 户 账号 ， 并 允许 它 不 论 从 哪里 登录 ， 都 可 以 无 需 密码 全 权 操 作 所 
有 数据 库 和 所 有 表 。 如 果 API 所 使 用 的 用 户 账号 确实 具有 所 有 数据 库 和 所 有 表 的 GRANT 和 
ALL 权限 ， 那 么 该 语句 就 会 顺利 执行 ， 创 建 一 个 没有 任何 限制 的 账号 bad_guy， 这 是 非常 危 
险 的 。 

为 了 避免 SQL 注入 这 种 问题 ， 我 们 应 该 在 API 中 查询 参数 的 位 置 上 ， 使 用 占 位 符 ， 而 非 
字符 串 拼接 。 本 章 前 面 的 例子 使 用 过 占 位 符 。 这 种 方法 会 将 参数 与 语句 独立 开 来 ， 可 以 通 
过 对 参数 中 的 引号 进行 跳 脱 处 理 来 实现 。 这 种 方法 可 能 看 上 去 设 什 么 了 不 起 ， 但 确实 非常 
有 效 。 
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如 果 上 例 用 了 占 位 符 ， 那 么 出 来 的 语句 就 会 是 这 样 : 


SELECT common_name, scientific name FROM birds 
WHERE Common_name LIKE '%\'; 


GRANT ALL PRIVILEGES ON *.* TO \'bad_guy\'@\'%\'; 
‘y's 


由 于 黑客 输入 的 引号 都 跳 脱 成 普通 字符 ， 它 们 不 会 被 当成 是 字符 串 的 结束 标志 ， 因 此 ， 
当 遇 到 黑客 输入 的 分 号 时 ， 不 会 开始 一 条 新 的 SQL 语句 。 用 这 样 的 参数 去 查询 是 没有 结 
果 的 ， 因 为 表 中 确实 没有 哪 种 鸟 叫 这 样 的 名 字 。 而 更 重要 的 是 ， 用 户 账号 bad_guy 不 会 
被 创建 。 


16.8 ”小结 


API 可 以 让 不 懂 MySQL 的 用 户 也 能 创建 程序 ， 同 时 ， 也 能 隔绝 用 户 对 数据 库 的 直接 操作 。 
它 能 给 你 提供 一 种 更 高 层次 的 安全 控 管 (尤其 是 控 管 来 自 Web 的 未 知 用 户 的 访问 )。 另 外 ， 
当 MySQL 本 身 没有 用 于 查询 你 想 要 的 信息 的 函数 时 ， 你 可 以 写 一 个 API 程序 来 进行 查询 ， 
补充 MySQL 的 不 足 。 总 的 来 说 ，API 是 自 定义 MySQL 和 MariaDB 的 强大 工具 。 

本 章 的 API 程序 示例 涉及 对 数据 的 查询 、 插 入 和 更 新 ， 其 中 有 简单 的 ， 也 有 进 阶 的 。 我 们 
几乎 没有 进行 错误 检查 ， 而 且 只 执行 了 一 些 简单 的 任务 。 虽 然 有 些 例 子 非常 基础 ， 但 应 该 
足够 让 你 了 解 如 何 用 API 连接 MySQL 和 MariaDB ， 以 及 查询 数据 库 。 如 果 想 做 得 更 好 ， 
就 要 自己 去 好 好 学 习 相 关 的 编程 语言 和 MySQL， 并 使 用 API 提供 的 更 多 函数 。 关 于 这 方 
看 ， 也 可 以 到 每 节 的 末尾 ， 看 看 我 给 你 推荐 的 书籍 和 其 他 资源 。 


16.9 习题 


你 可 以 用 自己 喜欢 的 任何 语言 的 API 来 完成 以 下 习题 。 如 果 没 有 特别 的 偏好 ， 可 以 试 试 

PHP。 它 有 很 多 用 户 ， 而 且 很 容易 上 手 。 

(1) 写 一 个 API 程 序 ， 连 接 MySQL， 并 查询 rookery 数据 库 。 用 SELECT 获取 一 些 鸟 的 信 
息 。 要 求 用 JOIN (可 参考 9.2 节 ) 来 连接 birds、bird_families 和 bird_orders 这 三 个 
表 ， 查 出 birds 的 btrd id、common_name 和 scientific_name， 以 及 bird_families 和 
bird_orders 的 scientific_name， 并 用 LIMIT 使 其 只 返回 100 种 鸟 。 写 完 后 ， 执 行 看 
看 。 如 果 是 用 PHP， 可 试 试 通过 浏览 器 来 显示 结果 。 

(2) 写 一 个 API 程序， 从 命令 行 或 浏览 器 (如 果 使 用 的 是 PHP) 接收 程序 用 户 的 数据 。 让 
程序 连接 MySQL 和 birdwatchers 数据 库 。 让 它 执 行 INSERT， 来 向 humans 表 中 添加 用 
户 提 供 的 数据 ， 注 意 只 是 添加 到 formal_title、name_first 和 name_Last 这 几 列 里 。 用 
CURDATE() 设置 join_date， 然 后 在 membership_type 中 填 basic。 

写 完 后 ， 运 行 它 并 输入 几 个 虚构 的 人 名 ， 再 用 mysql 客户 端 登 录 MySQL， 看 看 数据 录 
入 得 是 否 正 确 。 
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(3) 登 录 MySQL， 用 CREATE TABLE (在 4.2 节 中 讲 过 ) 在 本 章 开 头 创 建 的 server_admin 数 
据 库 中 建 表 backup_logs。 表 结构 至 少 要 有 记录 日 期 和 时 间 ， 以 及 备份 文件 名 称 的 列 ， 
其 他 随意 。 

使 用 GRANTS 语句 给 admin_backup 至 少 授 予 这 个 新 表 的 INSERT 和 SELECT 权限 (可 参考 
13.2.2 节 )。 

在 14.1.4 节 中 ， 我 们 试 过 用 shell 来 制作 备份 脚本 。 现 在 试 试用 API 来 做 ， 使 它 能 通过 
命令 行 ( 非 浏览 器 ) 被 调用 ， 完 成 相同 的 任务 。 你 不 需要 从 头 写 出 一 个 备份 工具 ， 只 要 
让 它 调用 mysqldump 就 可 以 了 。 写 完 后 ， 运 行程 序 看 看 能 不 能 生成 备份 文件 ， 以 及 文件 
名 是 否 正确 。 如 果 本 题 超出 你 现在 的 水 平 ， 那 就 暂时 先 跳 过 ， 等 以 后 你 对 API 更 熟练 
时 ， 再 回头 来 做 。 
如 果 API 程 序 能 生成 正确 的 备份 文件 ， 那 就 增加 一 步 ， 让 它 连 接 MySQL， 记 录 它 已 经 
成 功 运行 。 用 INSERT 插入 一 行 ， 记 录 程 序 运行 的 日 期 和 生成 的 备份 文件 的 名 称 。 改 完 
后 ， 再 运行 一 次 ， 看 看 有 没有 录入 这 些 信 息 。 

能 记录 的 话 ， 就 加 一 行 到 cron 或 其 他 调度 程序 中 ， 使 你 写 的 备份 程序 自动 运行 。 加 的 
时 候 ， 可 以 把 时 间 设 定 在 稍 后 ， 以 便 尽 快 检查 有 没有 加 成 功 。 确 认 成 功 后 ， 你 可 以 按 自 
己 的 意愿 移 除 或 保留 该 计划 任务 。 

(4) 写 一 个 API 程序 ， 先 查 出 所 有 鸟 科 ， 供 用 户 从 中 选择 ， 然 后 列 出 所 选 鸟 科 的 所 有 鸟 种 。 
如 果 你 用 的 是 可 以 在 浏览 器 中 使 用 的 PHP， 那 就 给 每 个 科 加 上 链接 ， 把 科 的 信息 发 回 
PHP 端 ， 用 于 后 续 查询 。 

如 果 你 的 程序 只 能 通过 命令 行 调 用 ， 那 就 在 显示 科 名 时 也 显示 family_id。 当 用 户 要 查 
某 科 的 鸟 种 时 ， 让 其 使 用 同一 命令 ， 但 要 带 上 family_id。 如 果 没 有 带 上 family_id， 就 
会 显示 一 堆 科 名 。 反 之 ， 则 会 显示 这 一 科 的 乌 种 列表 。 写 完 后 ， 运 行程 序 测 试 一 下 。 
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关于 作者 


Russell J.T. Dyer 是 住 在 意大利 米兰 的 一 位 作家 兼 编辑 。 他 现任 MariaDB 公司 课程 主 
管 ， 并 曾 在 MYSQL 公司 做 过 六 年 的 知识 库 编 辑 。 他 著 有 《MySQL 核心 技术 手册 》 一 书 
(http:Wshop.oreilly.com/product9780596514334.do) ， 还 写 过 数 百 篇 文章 ， 涉 及 的 领域 包括 
软件 (特别 是 MySQL)、 旅 游 、 摄 影 和 经 济 。 


在 亚马逊 网 站 ， 你 还 可 以 找到 Russell J.T. Dyer 写 的 第 一 本 小 说 Jn Search of Kafka。 这 本 
书 的 编辑 也 是 Andy Oram。 小 说 描写 的 是 一 位 计算 机 程序 员 不 小 心 惹 上 了 法 律 麻烦， 读 
起 来 很 有 趣 。 想 了 解 更 多 有 关 Russell 及 其 作品 的 信息 ， 可 以 浏览 他 的 个 人 网 站 (http:// 


russelljtdyer.com) 。 


关于 封面 


本 书 封 面 上 的 动物 是 黑 带 神仙 鱼 (banded angelfish)， 学 名 为 纪 背 阿波 鱼 (Apolemichthys 
arcuatus)。 所 谓 “ 黑 带 ”， 是 指 鱼 身 两 侧 从 鱼 眼 延伸 至 鱼 尾 的 黑 带 。 跟 其 所 属 的 盖 刺 鱼 科 
(Pomacanthidae) 中 的 其 他 海水 神仙 鱼 一 样 ， 黑 带 神仙 鱼 两 侧 很 扁 ， 背 鳍 很 软 。 另 外 ， 这 
种 鱼 也 叫 作 “ 贼 仙 鱼 "， 它 们 居住 在 夏 威 开 和 约翰 逊 环 礁 的 中 等 深度 水 域 的 洞穴 和 礁石 处 。 
不 同 品种 的 海水 神仙 鱼 在 行为 习性 上 有 很 大 的 差异 。 在 盖 刺 鱼 科 中 ， 有 的 品种 会 组 成 一 雄 
一 峻 的 配偶 ， 也 有 的 会 组 成 一 条 雄性 与 多 条 肉 性 相配 的 群体 。 而 又 因为 它们 是 叭 雄 同体 ， 
并 且 坎 性 先 熟 ， 所 以 一 旦 唯一 的 雄性 死去 或 离 去 ， 某 条 坎 性 就 会 转 为 雄性 ， 继 续 维 持 鱼 群 
的 单 雄 多 只 状态 。 

黑 带 神仙 鱼 主 食 海绵 动物 ， 此 外 也 食 藻 类 植物 和 某 些 无 背 椎 动物 。 因 为 这 些 食物 很 难 养 ， 
所 以 想 养 黑 带 神仙 鱼 的 水 族 馆 很 为 难 。 一 些 商 业 水 族 馆 为 了 维持 养殖 而 去 采 挖 册 瑚 礁 ， 导 
致 人 类 潜水 深度 附近 的 珊瑚 确 衰 减 。 

O’Reilly 图 书 封面 上 的 很 多 动物 都 濒临 灭绝 。 它 们 都 是 自然 界 所 剩 无 几 的 瑰宝 。 要 想 了 解 
如 何 帮助 它们 ， 可 以 访问 http://animals.oreilly.com。 


本 书 的 封面 图 片 来 自 Cuvier's Animals。 
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MVySOL 与 MariaDB 学 习 指南 


也 许 你 未 曾 意识 到 ， 但 你 时 常 在 与 MySQL 或 其 分 支 打交道 。 作 为 高 效 且 
稳定 的 开源 数据 库 ，MySQL 备 受 各 大 电 商 网 站 和 社会 媒体 网 站 青睐 。 若 
想 快 速 并 深入 了 解 如 何 使 用 和 维护 MySQL， 本 书 便 是 绝 佳 参 考 。 这 本 注 
重 实践 的 学 习 指 南 以 简单 明了 、 条 理 清晰 的 方式 ， 教 你 安装 、 使 用 和 维 
护 MySQL 及 其 重要 分 支 MariaDB。 


本 书 作 者 既是 MySQL 与 MariaDB 专 家 ， 也 是 小 说 家 。 他 以 生动 的 语言 和 
翔实 的 示例 分 析 带 你 领略 数据 库 设 计 和 数据 管理 的 方方面面 。 章 末 精 心 
设计 的 习题 将 有 助 于 你 温 故 而 知 新 。 


国 创建 和 修改 MySQL 表 ， 并 在 其 中 声明 字段 和 列 

加 通过 示例 ， 掌 握 数据 的 插入 、 选 取 、 更 新 、 删 除 、 连 接 和 子 查 询 
年 使 用 字符 串 函 数 对 列 中 的 文本 进行 查找 、 抽 取 、 格 式 化 和 转换 
是 学 习 用 于 数学 或 统计 运算 ， 以 及 日 期 和 时 间 格 式 化 的 相关 函数 
是 执行 管理 任务 ， 例 如 管理 账号 、 备 份 数 据 库 和 批量 导入 数据 

加 使 用 PHP 等 各 种 编程 语言 的 API 连 接 和 查询 MySQL 或 MariaDB 


Russell J.T. Dyer 现 任 MariaDB 公 司 课程 主管 ， 同 时 是 一 位 小 说 家 。 他 曾 在 


MySQL 公 司 做 过 近 六 年 的 知识 库 编辑 ， 拥 有 丰富 的 MySQL 实 践 经 验 ， 另 著 
《MySQL 核 心 技术 手册 》 。 作 为 小 说 家 ， 他 目前 正在 创作 第 二 部 小 说 。 














“本 书 介绍 的 数据 库 开发 和 管理 


通用 技能 ， 将 使 你 终身 受益 。” 
一 一 Monty Widenius 
MySQL 与 MariaDB 之 父 


“MySQL 和 MariaDB 都 是 流行 的 


数据 库 ， 阅 读本 书 能 让 你 快速 
地 掌握 它们 。Russell 举 的 例子 
简单 易 懂 ， 并 且 贯 穿 整个 学 习 
过 程 ， 能 助 你 迈 入 数据 库 专家 
行列 。” 
一 一 Colin Charles 
MariaDB 公 司 前 首席 布道 官 ， 
现任 Percona 公 司 首席 布道 官 
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